文本檢索方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器
基本信息
申請(qǐng)?zhí)?/td> | CN202111404155.8 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114090799A | 公開(公告)日 | 2022-02-25 |
申請(qǐng)公布號(hào) | CN114090799A | 申請(qǐng)公布日 | 2022-02-25 |
分類號(hào) | G06F16/383(2019.01)I;G06F16/33(2019.01)I;G06F16/338(2019.01)I;G06F16/31(2019.01)I;G06F16/36(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 汪敏;嚴(yán)妍;裴非;趙達(dá);張路 | 申請(qǐng)(專利權(quán))人 | 北京開普云信息科技有限公司 |
代理機(jī)構(gòu) | 北京德崇智捷知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 邢飛飛 |
地址 | 523000廣東省東莞市石龍鎮(zhèn)中山東東升路1號(hào)匯星商業(yè)中心5棟2單元1805室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種文本檢索方法、裝置、存儲(chǔ)介質(zhì)及服務(wù)器,屬于數(shù)據(jù)檢索技術(shù)領(lǐng)域。所述方法包括:獲取待檢索的第一專利文本的第一詞袋組合和第一專利信息;獲取專利數(shù)據(jù)庫(kù)中每個(gè)第二專利文本的第二詞袋組合和第二專利信息;根據(jù)第一詞袋組合、第二詞袋組合和詞條的IPC權(quán)重,篩選與第一專利文本相似的n個(gè)第二專利文本,得到粗選集;根據(jù)第一詞袋組合、粗選集中的第二詞袋組合、各個(gè)詞條之間的余弦距離和IPC權(quán)重,從粗選集中篩選與第一專利文本相似的m個(gè)第二專利文本,得到細(xì)選集;根據(jù)第一專利信息與第二專利信息的匹配度,對(duì)細(xì)選集中的各個(gè)第二專利文本的排序進(jìn)行調(diào)整,得到檢索結(jié)果。本申請(qǐng)可以提高檢索效率和準(zhǔn)確率。 |
