一種基于關(guān)鍵詞的長(zhǎng)文本問答對(duì)生成系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN202010670132.0 申請(qǐng)日 -
公開(公告)號(hào) CN111914062A 公開(公告)日 2020-11-10
申請(qǐng)公布號(hào) CN111914062A 申請(qǐng)公布日 2020-11-10
分類號(hào) G06F16/33(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱其立;沈李斌;張盛瑤;郭子路;李愷健;奚寧;李波 申請(qǐng)(專利權(quán))人 上海樂言科技股份有限公司
代理機(jī)構(gòu) 上海專利商標(biāo)事務(wù)所有限公司 代理人 施浩
地址 200050 上海市長(zhǎng)寧區(qū)長(zhǎng)寧路1033號(hào)聯(lián)通大廈19樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于關(guān)鍵詞的長(zhǎng)文本問答對(duì)生成系統(tǒng),實(shí)現(xiàn)根據(jù)文本及關(guān)鍵詞生成與關(guān)鍵詞相關(guān)且有意義的問答對(duì)。其技術(shù)方案為:系統(tǒng)包括生成模塊和評(píng)估模塊,生成模塊針對(duì)段落及關(guān)鍵詞生成與關(guān)鍵詞相關(guān)的問答對(duì),評(píng)估模塊通過自動(dòng)評(píng)估方式評(píng)價(jià)問答對(duì)質(zhì)量。生成模塊基于三階段生成模型生成問答對(duì):依次串聯(lián)的段落檢索單元、答案范圍提取單元以及問題生成單元。其中段落檢索單元用于基于信息檢索模型,根據(jù)關(guān)鍵詞從文本中檢索出候選問答對(duì)在長(zhǎng)文本中所處的候選段落;答案范圍提取單元用于從候選段落中提取出可能存在的答案范圍;問題生成單元根據(jù)候選段落和答案范圍中的其中一個(gè)答案,生成問題并和答案組成與關(guān)鍵詞相關(guān)的問答對(duì)。??