基于RM算法提升特寫詞語搜索精度的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201710189291.7 申請日 -
公開(公告)號 CN106951548B 公開(公告)日 2020-07-17
申請公布號 CN106951548B 申請公布日 2020-07-17
分類號 G06F16/951;G06F16/953;G06F16/9535;G06F40/284;G06F40/247 分類 -
發(fā)明人 陳剛;曾明;宋濤;李京 申請(專利權(quán))人 聚龍融創(chuàng)科技有限公司
代理機(jī)構(gòu) 北京律智知識產(chǎn)權(quán)代理有限公司 代理人 聚龍融創(chuàng)科技有限公司
地址 100094 北京市海淀區(qū)東北旺西路8號院23號樓三層301
法律狀態(tài) -

摘要

摘要 本公開提供了一種基于RM算法提升特寫詞語搜索精度的方法及系統(tǒng)、電子設(shè)備。該基于RM算法提升特寫詞語搜索精度的方法包括:根據(jù)數(shù)據(jù)采集獲取的網(wǎng)絡(luò)爬蟲數(shù)據(jù)和企業(yè)內(nèi)部數(shù)據(jù)構(gòu)建自定義分詞庫;采用多種預(yù)設(shè)分詞算法對接收的查詢語句進(jìn)行分詞,獲取多組分詞結(jié)果;采用所述多組分詞結(jié)果分別進(jìn)行搜索,并計(jì)算各組的搜索得分;根據(jù)各組的搜索得分及相應(yīng)的分詞結(jié)果對所述自定義分詞庫進(jìn)行修正。本發(fā)明的技術(shù)方案能夠有效提高特定業(yè)務(wù)場景的分詞精度和搜索準(zhǔn)確度。