一種問答檢索系統(tǒng)的同義詞挖掘方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910672217.X 申請(qǐng)日 -
公開(公告)號(hào) CN110442760B 公開(公告)日 2022-02-15
申請(qǐng)公布號(hào) CN110442760B 申請(qǐng)公布日 2022-02-15
分類號(hào) G06F16/9032(2019.01)I;G06F16/906(2019.01)I;G06F16/951(2019.01)I;G06F40/247(2020.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭申文;丁鍇;陳濤;王開紅;李建元 申請(qǐng)(專利權(quán))人 銀江技術(shù)股份有限公司
代理機(jī)構(gòu) 杭州之江專利事務(wù)所(普通合伙) 代理人 張慧英
地址 310012 浙江省杭州市益樂路223號(hào)1幢1層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種問答檢索系統(tǒng)的同義詞挖掘方法及裝置,本發(fā)明通過對(duì)問答語料分類,按類別進(jìn)行關(guān)鍵詞提取,得到待處理關(guān)鍵詞集,同時(shí)對(duì)垂直領(lǐng)域內(nèi)的大語料進(jìn)行詞向量訓(xùn)練,并計(jì)算詞向量的余弦相似度,得到當(dāng)前類別關(guān)鍵詞的廣義相關(guān)詞集合,然后進(jìn)行詞性篩選,得到縮略相關(guān)詞集,再計(jì)算縮略相關(guān)詞集合內(nèi)的歐式距離,得到同義詞對(duì),并統(tǒng)計(jì)同義詞對(duì)的共現(xiàn)頻次,計(jì)算同義詞的替換概率,最終根據(jù)同義詞對(duì)替換后的檢索召回結(jié)果,對(duì)不滿足檢索召回閾值的同義詞對(duì),進(jìn)行反饋修正,較好的解決了同義詞替換后的語義變形問題,提高了同義詞挖掘的準(zhǔn)確度以及問答對(duì)檢索結(jié)果的準(zhǔn)確性。