一種基于WMD的中文問答匹配方法

基本信息

申請?zhí)?/td> CN201710539034.1 申請日 -
公開(公告)號 CN107391614A 公開(公告)日 2017-11-24
申請公布號 CN107391614A 申請公布日 2017-11-24
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 杜云貴;杜若;李智星;侯聰;晏世凱;劉科 申請(專利權(quán))人 重慶智慧思特大數(shù)據(jù)有限公司
代理機(jī)構(gòu) 重慶市恒信知識產(chǎn)權(quán)代理有限公司 代理人 重慶智慧思特大數(shù)據(jù)有限公司;重慶明斯基數(shù)據(jù)科技有限公司
地址 400065 重慶市南岸區(qū)廣福大道12號3號樓22樓
法律狀態(tài) -

摘要

摘要 本發(fā)明請求保護(hù)一種基于WMD的中文問答匹配方法,涉及自然語言處理領(lǐng)域。包括步驟:目標(biāo)領(lǐng)域的知識庫的建立步驟:對知識庫的數(shù)據(jù)預(yù)處理步驟:常用同義詞詞典的建立步驟:詞語距離字典的建立步驟:用戶提問信息的預(yù)處理步驟:文檔向量化表示步驟:問句檢索及問句匹配步驟:答案返回。采用改進(jìn)的WMD距離算法度量問句之間的相似性。區(qū)別于搜索引擎,本發(fā)明允許用戶以自然語言的方式查詢,并直接返回工整的答案。值得一提的是,本發(fā)明在問句匹配過程中兼顧了問句的外在表現(xiàn)形式和問句的內(nèi)在語義信息,使得本發(fā)明能夠應(yīng)對用戶提出的類型更為復(fù)雜的問句。