一種問答檢索系統(tǒng)的同義詞挖掘方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201910672217.X | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110442760B | 公開(公告)日 | 2022-02-15 |
申請(qǐng)公布號(hào) | CN110442760B | 申請(qǐng)公布日 | 2022-02-15 |
分類號(hào) | G06F16/9032(2019.01)I;G06F16/906(2019.01)I;G06F16/951(2019.01)I;G06F40/247(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鄭申文;丁鍇;陳濤;王開紅;李建元 | 申請(qǐng)(專利權(quán))人 | 銀江技術(shù)股份有限公司 |
代理機(jī)構(gòu) | 杭州之江專利事務(wù)所(普通合伙) | 代理人 | 張慧英 |
地址 | 310012 浙江省杭州市益樂路223號(hào)1幢1層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種問答檢索系統(tǒng)的同義詞挖掘方法及裝置,本發(fā)明通過對(duì)問答語料分類,按類別進(jìn)行關(guān)鍵詞提取,得到待處理關(guān)鍵詞集,同時(shí)對(duì)垂直領(lǐng)域內(nèi)的大語料進(jìn)行詞向量訓(xùn)練,并計(jì)算詞向量的余弦相似度,得到當(dāng)前類別關(guān)鍵詞的廣義相關(guān)詞集合,然后進(jìn)行詞性篩選,得到縮略相關(guān)詞集,再計(jì)算縮略相關(guān)詞集合內(nèi)的歐式距離,得到同義詞對(duì),并統(tǒng)計(jì)同義詞對(duì)的共現(xiàn)頻次,計(jì)算同義詞的替換概率,最終根據(jù)同義詞對(duì)替換后的檢索召回結(jié)果,對(duì)不滿足檢索召回閾值的同義詞對(duì),進(jìn)行反饋修正,較好的解決了同義詞替換后的語義變形問題,提高了同義詞挖掘的準(zhǔn)確度以及問答對(duì)檢索結(jié)果的準(zhǔn)確性。 |
