文本檢索方法、裝置、計算機設(shè)備和存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202010545374.7 申請日 -
公開(公告)號 CN111444320B 公開(公告)日 2020-07-24
申請公布號 CN111444320B 申請公布日 2020-07-24
分類號 G06F16/33(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 時愛民;楊剛;葉俊鋒;仲如星 申請(專利權(quán))人 太平財產(chǎn)保險有限公司
代理機構(gòu) 廣州華進聯(lián)合專利商標(biāo)代理有限公司 代理人 黃麗霞
地址 201201上海市浦東新區(qū)卡園三路58號
法律狀態(tài) -

摘要

摘要 本申請涉及一種文本檢索方法、裝置、計算機設(shè)備和存儲介質(zhì)。所述方法通過響應(yīng)于文本檢索請求,將文本檢索請求中的檢索語句在待檢索文本集中通過TF?IDF算法進行匹配,得到匹配的設(shè)定個數(shù)的候選文本,并通過語義表示學(xué)習(xí)模型獲取檢索語句的第一特征向量和每個候選文本中重要文本段的第二特征向量,并根據(jù)檢索語句的第一特征向量和每個候選文本中重要文本段的第二特征向量之間的相似度,獲取相似度較高的目標(biāo)個數(shù)的候選文本,進而根據(jù)目標(biāo)個數(shù)的候選文本中每個候選文本相對于檢索語句的歷史關(guān)聯(lián)度的大小對目標(biāo)個數(shù)的候選文本進行排序,其通過兩次篩選和排序從而實現(xiàn)基于語義理解的文本檢索,不僅提高了文本檢索的匹配度,且提高了檢索效率。??