一種基于文檔進(jìn)行檢索的方法及裝置

基本信息

申請?zhí)?/td> CN202110494158.9 申請日 -
公開(公告)號 CN113094519A 公開(公告)日 2021-07-09
申請公布號 CN113094519A 申請公布日 2021-07-09
分類號 G06F16/38(2019.01)I;G06F16/33(2019.01)I;G06F40/284(2020.01)I;G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 武彬峰 申請(專利權(quán))人 超凡知識產(chǎn)權(quán)服務(wù)股份有限公司
代理機(jī)構(gòu) 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) 代理人 董艷芳
地址 610000四川省成都市高新區(qū)天府三街199號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于文檔進(jìn)行檢索的方法及裝置,方法包括:依據(jù)輸入的待檢索文檔進(jìn)行檢索,獲取候選檢索文檔;針對每一候選檢索文檔,合并該候選檢索文檔與待檢索文檔,得到合并文檔,構(gòu)建包含待檢索文檔、候選檢索文檔以及合并文檔的相似度文檔集;以合并文檔為匹配對象,在相似度文檔集中進(jìn)行相似度匹配,分別得到合并文檔的第一相似分?jǐn)?shù)、待檢索文檔與合并文檔的第二相似分?jǐn)?shù)、候選檢索文檔與合并文檔的第三相似分?jǐn)?shù);將第一相似分?jǐn)?shù)、第二相似分?jǐn)?shù)以及第三相似分?jǐn)?shù)應(yīng)用于相似度值計(jì)算公式,得到候選檢索文檔與待檢索文檔的相似度值;基于相似度值,對所述多個候選檢索文檔進(jìn)行排序,依據(jù)排序結(jié)果返回檢索結(jié)果??梢蕴岣邫z索效率。