基于詞向量的高效率語義拓展檢索方法、裝置及存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202111346635.3 | 申請日 | - |
公開(公告)號 | CN114116953A | 公開(公告)日 | 2022-03-01 |
申請公布號 | CN114116953A | 申請公布日 | 2022-03-01 |
分類號 | G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 何夏輝;俞書浩;王凱麗;曹心怡;陳昱瑩 | 申請(專利權)人 | 交通銀行股份有限公司 |
代理機構 | 上??剖⒅R產(chǎn)權代理有限公司 | 代理人 | 蔡彭君 |
地址 | 200120上海市浦東新區(qū)自由貿(mào)易試驗區(qū)銀城中路188號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于詞向量的高效率語義拓展檢索方法、裝置及存儲介質(zhì),其中方法包括:步驟S1:進行語料清洗得到統(tǒng)一格式的語料;步驟S2:對語料進行分詞,得到詞匯;步驟S3:將所有詞匯利用訓練好的詞向量模型轉(zhuǎn)換為詞向量;步驟S4:基于余弦距離采用二叉樹法對詞向量建立索引;步驟S5:接收檢索關鍵詞,并轉(zhuǎn)換為詞向量,利用建立好的索引得到近義詞;步驟S6:將關鍵詞進行分詞;步驟S7:分別以原詞、近義詞,以及分詞進行研報檢索,得到原詞檢索結果、近義詞檢索結果和分詞檢索結果;步驟S8:將同時出現(xiàn)在原詞檢索結果、近義詞檢索結果和分詞檢索結果中的研報作為最優(yōu)先級結果進行呈現(xiàn)。與現(xiàn)有技術相比,本發(fā)明具有提高響應速度和準確性等優(yōu)點。 |
