一種基于深度學(xué)習(xí)的從非結(jié)構(gòu)化文本中獲取問(wèn)答對(duì)的方法

基本信息

申請(qǐng)?zhí)?/td> CN201910220102.7 申請(qǐng)日 -
公開(公告)號(hào) CN110110054A 公開(公告)日 2021-06-08
申請(qǐng)公布號(hào) CN110110054A 申請(qǐng)公布日 2021-06-08
分類號(hào) G06F16/332;G06F17/27;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王丙棟;朱江平;游世學(xué) 申請(qǐng)(專利權(quán))人 北京中科匯聯(lián)科技股份有限公司
代理機(jī)構(gòu) 北京慶峰財(cái)智知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 李文軍
地址 100094 北京市海淀區(qū)東北旺西路8號(hào)9號(hào)樓二區(qū)305
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學(xué)習(xí)的從非結(jié)構(gòu)化文本中獲取問(wèn)答對(duì)的方法,包括如下步驟:文本規(guī)格化處理;基于深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行句子分類和配對(duì)及關(guān)鍵短語(yǔ)提??;文本內(nèi)部的問(wèn)答對(duì)獲?。晃谋就獠康膯?wèn)答對(duì)爬??;問(wèn)答對(duì)匯總?cè)ブ?。本發(fā)明,針對(duì)問(wèn)答對(duì)獲取困難的問(wèn)題,通過(guò)有效利用容易獲取的非結(jié)構(gòu)化文檔資源,結(jié)合使用深度神經(jīng)網(wǎng)絡(luò)模型,自動(dòng)高效地獲取成規(guī)模的問(wèn)答對(duì),供人工校對(duì)、補(bǔ)充使用,降低了構(gòu)建知識(shí)庫(kù)的成本,加快了構(gòu)建知識(shí)庫(kù)的構(gòu)建速度。