一種基于關(guān)鍵詞的長文本問答對生成系統(tǒng)

基本信息

申請?zhí)?/td> CN202010670132.0 申請日 -
公開(公告)號 CN111914062B 公開(公告)日 2021-04-06
申請公布號 CN111914062B 申請公布日 2021-04-06
分類號 G06F16/332(2019.01)I;G06N3/08(2006.01)I;G06F16/33(2019.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06F40/289(2020.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 朱其立;沈李斌;張盛瑤;郭子路;李愷健;奚寧;李波 申請(專利權(quán))人 上海樂言科技股份有限公司
代理機構(gòu) 上海專利商標(biāo)事務(wù)所有限公司 代理人 施浩
地址 200050 上海市長寧區(qū)長寧路1033號聯(lián)通大廈19樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于關(guān)鍵詞的長文本問答對生成系統(tǒng),實現(xiàn)根據(jù)文本及關(guān)鍵詞生成與關(guān)鍵詞相關(guān)且有意義的問答對。其技術(shù)方案為:系統(tǒng)包括生成模塊和評估模塊,生成模塊針對段落及關(guān)鍵詞生成與關(guān)鍵詞相關(guān)的問答對,評估模塊通過自動評估方式評價問答對質(zhì)量。生成模塊基于三階段生成模型生成問答對:依次串聯(lián)的段落檢索單元、答案范圍提取單元以及問題生成單元。其中段落檢索單元用于基于信息檢索模型,根據(jù)關(guān)鍵詞從文本中檢索出候選問答對在長文本中所處的候選段落;答案范圍提取單元用于從候選段落中提取出可能存在的答案范圍;問題生成單元根據(jù)候選段落和答案范圍中的其中一個答案,生成問題并和答案組成與關(guān)鍵詞相關(guān)的問答對。??