一種基于Word2Vec的中文問答語義相似度計算方法

基本信息

申請?zhí)?/td> CN201710661607.8 申請日 -
公開(公告)號 CN107436864A 公開(公告)日 2017-12-05
申請公布號 CN107436864A 申請公布日 2017-12-05
分類號 G06F17/27(2006.01)I;G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王春輝 申請(專利權)人 逸途(北京)科技有限公司
代理機構 北京國坤專利代理事務所(普通合伙) 代理人 逸途(北京)科技有限公司
地址 100015 北京市朝陽區(qū)酒仙橋路4號宏源大廈1904
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于Word2Vec的中文問答語義相似度計算方法,包括文本預處理、向量表示和相似度計算。本發(fā)明的有益效果是:提出的中文問答語義相似度計算方法結合了基于關鍵詞的文本相似度以及基于Word2Vec的語義相似度,具有較高的效率和準確率,綜合重合關鍵詞的文本相似度與非重合關鍵詞的語義相似度,一方面引入語義,解決了關鍵詞高度重合的文本語義相似度計算問題,另一方面避免了短文本造成的語義相似度計算存在較大誤差的問題,提高了中文語句相似度計算的準確性。