一種文本相似度計(jì)算方法、裝置、設(shè)備及存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202111129085.X 申請日 -
公開(公告)號 CN113987115A 公開(公告)日 2022-01-28
申請公布號 CN113987115A 申請公布日 2022-01-28
分類號 G06F16/33(2019.01)I;G06F40/194(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王偉;黃勇其;于翠翠;張黔 申請(專利權(quán))人 華潤數(shù)字科技(西安)有限公司
代理機(jī)構(gòu) 深圳市世聯(lián)合知識產(chǎn)權(quán)代理有限公司 代理人 姜妍
地址 710000陜西省西安市高新區(qū)天谷八路211號環(huán)普科技產(chǎn)業(yè)園C座303、304室
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例屬于人工智能領(lǐng)域,尤其涉及一種文本相似度計(jì)算方法、裝置、設(shè)備及存儲介質(zhì),所述方法包括:識別待比對文本中的數(shù)學(xué)符號,根據(jù)預(yù)設(shè)的符號?文字字典查找數(shù)學(xué)符號對應(yīng)的文字描述,并將待比對文本中的數(shù)學(xué)符號替換成查找到的文字描述;對待比對文本進(jìn)行分詞,基于分詞計(jì)算待比對文本中每個句子的初級表征向量,其中待比對文本至少為兩個;將不同的待比對文本中每個句子的初級表征向量輸入到語義編碼器,通過語義編碼器計(jì)算得到待比對文本的最終表征向量,語義編碼器至少為兩個;及語義編碼器將待比對文本的最終表征向量輸入到相似度計(jì)算器,獲取不同兩個待比對文本的相似度。本發(fā)明提高了相似性度計(jì)算的穩(wěn)定性和準(zhǔn)確性。