一種基于WMD的中文問答匹配方法
基本信息
申請?zhí)?/td> | CN201710539034.1 | 申請日 | - |
公開(公告)號 | CN107391614A | 公開(公告)日 | 2017-11-24 |
申請公布號 | CN107391614A | 申請公布日 | 2017-11-24 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 杜云貴;杜若;李智星;侯聰;晏世凱;劉科 | 申請(專利權(quán))人 | 重慶智慧思特大數(shù)據(jù)有限公司 |
代理機(jī)構(gòu) | 重慶市恒信知識產(chǎn)權(quán)代理有限公司 | 代理人 | 重慶智慧思特大數(shù)據(jù)有限公司;重慶明斯基數(shù)據(jù)科技有限公司 |
地址 | 400065 重慶市南岸區(qū)廣福大道12號3號樓22樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明請求保護(hù)一種基于WMD的中文問答匹配方法,涉及自然語言處理領(lǐng)域。包括步驟:目標(biāo)領(lǐng)域的知識庫的建立步驟:對知識庫的數(shù)據(jù)預(yù)處理步驟:常用同義詞詞典的建立步驟:詞語距離字典的建立步驟:用戶提問信息的預(yù)處理步驟:文檔向量化表示步驟:問句檢索及問句匹配步驟:答案返回。采用改進(jìn)的WMD距離算法度量問句之間的相似性。區(qū)別于搜索引擎,本發(fā)明允許用戶以自然語言的方式查詢,并直接返回工整的答案。值得一提的是,本發(fā)明在問句匹配過程中兼顧了問句的外在表現(xiàn)形式和問句的內(nèi)在語義信息,使得本發(fā)明能夠應(yīng)對用戶提出的類型更為復(fù)雜的問句。 |
