一種基于Word2Vec的中文問答語義相似度計算方法

基本信息

申請?zhí)?/td> CN201710661607.8 申請日 -
公開(公告)號 CN107436864B 公開(公告)日 2021-03-02
申請公布號 CN107436864B 申請公布日 2021-03-02
分類號 G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/33(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王春輝 申請(專利權)人 識因智能科技(北京)有限公司
代理機構 北京國坤專利代理事務所(普通合伙) 代理人 趙紅霞
地址 100043北京市石景山區(qū)八大處路49號院6號樓七層717號(集群注冊)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Word2Vec的中文問答語義相似度計算方法,包括文本預處理、向量表示和相似度計算。本發(fā)明的有益效果是:提出的中文問答語義相似度計算方法結合了基于關鍵詞的文本相似度以及基于Word2Vec的語義相似度,具有較高的效率和準確率,綜合重合關鍵詞的文本相似度與非重合關鍵詞的語義相似度,一方面引入語義,解決了關鍵詞高度重合的文本語義相似度計算問題,另一方面避免了短文本造成的語義相似度計算存在較大誤差的問題,提高了中文語句相似度計算的準確性。??