一種基于文檔進(jìn)行檢索的方法及裝置
基本信息
申請?zhí)?/td> | CN202110494158.9 | 申請日 | - |
公開(公告)號 | CN113094519A | 公開(公告)日 | 2021-07-09 |
申請公布號 | CN113094519A | 申請公布日 | 2021-07-09 |
分類號 | G06F16/38(2019.01)I;G06F16/33(2019.01)I;G06F40/284(2020.01)I;G06K9/62(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 武彬峰 | 申請(專利權(quán))人 | 超凡知識產(chǎn)權(quán)服務(wù)股份有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 董艷芳 |
地址 | 610000四川省成都市高新區(qū)天府三街199號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于文檔進(jìn)行檢索的方法及裝置,方法包括:依據(jù)輸入的待檢索文檔進(jìn)行檢索,獲取候選檢索文檔;針對每一候選檢索文檔,合并該候選檢索文檔與待檢索文檔,得到合并文檔,構(gòu)建包含待檢索文檔、候選檢索文檔以及合并文檔的相似度文檔集;以合并文檔為匹配對象,在相似度文檔集中進(jìn)行相似度匹配,分別得到合并文檔的第一相似分?jǐn)?shù)、待檢索文檔與合并文檔的第二相似分?jǐn)?shù)、候選檢索文檔與合并文檔的第三相似分?jǐn)?shù);將第一相似分?jǐn)?shù)、第二相似分?jǐn)?shù)以及第三相似分?jǐn)?shù)應(yīng)用于相似度值計(jì)算公式,得到候選檢索文檔與待檢索文檔的相似度值;基于相似度值,對所述多個候選檢索文檔進(jìn)行排序,依據(jù)排序結(jié)果返回檢索結(jié)果??梢蕴岣邫z索效率。 |
