一種應(yīng)用于新聞?lì)I(lǐng)域的短文本匹配方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202011424390.7 申請日 -
公開(公告)號 CN112527957A 公開(公告)日 2021-03-19
申請公布號 CN112527957A 申請公布日 2021-03-19
分類號 G06F16/33(2019.01)I;G06F16/31(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張友豪;馮衛(wèi)強(qiáng) 申請(專利權(quán))人 上海大智慧財(cái)匯數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 上海段和段律師事務(wù)所 代理人 高璀璀;郭國中
地址 200120上海市浦東新區(qū)自由貿(mào)易試驗(yàn)區(qū)郭守敬路498號12幢21501-21507室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種應(yīng)用于新聞?lì)I(lǐng)域的短文本匹配方法及系統(tǒng),包括:步驟M1:將待匹配的機(jī)構(gòu)詞利用k字前綴樹方法構(gòu)建機(jī)構(gòu)索引;步驟M2:將機(jī)構(gòu)索引及待匹配的新聞按照預(yù)設(shè)格式進(jìn)行存儲;步驟M3:根據(jù)待匹配新聞以及機(jī)構(gòu)索引進(jìn)行新聞機(jī)構(gòu)匹配。本發(fā)明能夠在海量新聞數(shù)據(jù)中,能夠快速匹配相關(guān)機(jī)構(gòu),解決新聞數(shù)據(jù)匹配效率低,提高查詢效率,同時(shí)節(jié)省存儲空間。??