一種基于深度學習的從非結(jié)構(gòu)化文本中獲取問答對的方法

基本信息

申請?zhí)?/td> CN201910220102.7 申請日 -
公開(公告)號 CN110110054B 公開(公告)日 2021-06-08
申請公布號 CN110110054B 申請公布日 2021-06-08
分類號 G06F16/332;G06F40/289;G06F40/211;G06N3/04 分類 計算;推算;計數(shù);
發(fā)明人 王丙棟;朱江平;游世學 申請(專利權(quán))人 北京中科匯聯(lián)科技股份有限公司
代理機構(gòu) 北京慶峰財智知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李文軍
地址 100094 北京市海淀區(qū)東北旺西路8號9號樓二區(qū)305
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學習的從非結(jié)構(gòu)化文本中獲取問答對的方法,包括如下步驟:文本規(guī)格化處理;基于深度神經(jīng)網(wǎng)絡(luò)模型進行句子分類和配對及關(guān)鍵短語提?。晃谋緝?nèi)部的問答對獲?。晃谋就獠康膯柎饘ε廊?;問答對匯總?cè)ブ亍1景l(fā)明,針對問答對獲取困難的問題,通過有效利用容易獲取的非結(jié)構(gòu)化文檔資源,結(jié)合使用深度神經(jīng)網(wǎng)絡(luò)模型,自動高效地獲取成規(guī)模的問答對,供人工校對、補充使用,降低了構(gòu)建知識庫的成本,加快了構(gòu)建知識庫的構(gòu)建速度。