基于詞向量的高效率語義拓展檢索方法、裝置及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202111346635.3 申請日 -
公開(公告)號 CN114116953A 公開(公告)日 2022-03-01
申請公布號 CN114116953A 申請公布日 2022-03-01
分類號 G06F16/31(2019.01)I;G06F16/33(2019.01)I;G06F40/247(2020.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I 分類 計算;推算;計數(shù);
發(fā)明人 何夏輝;俞書浩;王凱麗;曹心怡;陳昱瑩 申請(專利權)人 交通銀行股份有限公司
代理機構 上??剖⒅R產(chǎn)權代理有限公司 代理人 蔡彭君
地址 200120上海市浦東新區(qū)自由貿(mào)易試驗區(qū)銀城中路188號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于詞向量的高效率語義拓展檢索方法、裝置及存儲介質(zhì),其中方法包括:步驟S1:進行語料清洗得到統(tǒng)一格式的語料;步驟S2:對語料進行分詞,得到詞匯;步驟S3:將所有詞匯利用訓練好的詞向量模型轉(zhuǎn)換為詞向量;步驟S4:基于余弦距離采用二叉樹法對詞向量建立索引;步驟S5:接收檢索關鍵詞,并轉(zhuǎn)換為詞向量,利用建立好的索引得到近義詞;步驟S6:將關鍵詞進行分詞;步驟S7:分別以原詞、近義詞,以及分詞進行研報檢索,得到原詞檢索結果、近義詞檢索結果和分詞檢索結果;步驟S8:將同時出現(xiàn)在原詞檢索結果、近義詞檢索結果和分詞檢索結果中的研報作為最優(yōu)先級結果進行呈現(xiàn)。與現(xiàn)有技術相比,本發(fā)明具有提高響應速度和準確性等優(yōu)點。