基于RM算法提升特寫詞語搜索精度的方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201710189291.7 申請(qǐng)日 -
公開(公告)號(hào) CN106951548A 公開(公告)日 2017-07-14
申請(qǐng)公布號(hào) CN106951548A 申請(qǐng)公布日 2017-07-14
分類號(hào) G06F17/30;G06F17/27 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳剛;曾明;宋濤;李京 申請(qǐng)(專利權(quán))人 聚龍融創(chuàng)科技有限公司
代理機(jī)構(gòu) 北京律智知識(shí)產(chǎn)權(quán)代理有限公司 代理人 聚龍融創(chuàng)科技有限公司
地址 100094 北京市海淀區(qū)東北旺西路8號(hào)院23號(hào)樓三層301
法律狀態(tài) -

摘要

摘要 本公開提供了一種基于RM算法提升特寫詞語搜索精度的方法及系統(tǒng)、電子設(shè)備。該基于RM算法提升特寫詞語搜索精度的方法包括:根據(jù)數(shù)據(jù)采集獲取的網(wǎng)絡(luò)爬蟲數(shù)據(jù)和企業(yè)內(nèi)部數(shù)據(jù)構(gòu)建自定義分詞庫(kù);采用多種預(yù)設(shè)分詞算法對(duì)接收的查詢語句進(jìn)行分詞,獲取多組分詞結(jié)果;采用所述多組分詞結(jié)果分別進(jìn)行搜索,并計(jì)算各組的搜索得分;根據(jù)各組的搜索得分及相應(yīng)的分詞結(jié)果對(duì)所述自定義分詞庫(kù)進(jìn)行修正。本發(fā)明的技術(shù)方案能夠有效提高特定業(yè)務(wù)場(chǎng)景的分詞精度和搜索準(zhǔn)確度。