一種基于關鍵詞的長文本問答對生成系統

基本信息

申請?zhí)?/td> CN202010670132.0 申請日 -
公開(公告)號 CN111914062A 公開(公告)日 2020-11-10
申請公布號 CN111914062A 申請公布日 2020-11-10
分類號 G06F16/33(2019.01)I 分類 計算;推算;計數;
發(fā)明人 朱其立;沈李斌;張盛瑤;郭子路;李愷健;奚寧;李波 申請(專利權)人 上海樂言科技股份有限公司
代理機構 上海專利商標事務所有限公司 代理人 施浩
地址 200050 上海市長寧區(qū)長寧路1033號聯通大廈19樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了基于關鍵詞的長文本問答對生成系統,實現根據文本及關鍵詞生成與關鍵詞相關且有意義的問答對。其技術方案為:系統包括生成模塊和評估模塊,生成模塊針對段落及關鍵詞生成與關鍵詞相關的問答對,評估模塊通過自動評估方式評價問答對質量。生成模塊基于三階段生成模型生成問答對:依次串聯的段落檢索單元、答案范圍提取單元以及問題生成單元。其中段落檢索單元用于基于信息檢索模型,根據關鍵詞從文本中檢索出候選問答對在長文本中所處的候選段落;答案范圍提取單元用于從候選段落中提取出可能存在的答案范圍;問題生成單元根據候選段落和答案范圍中的其中一個答案,生成問題并和答案組成與關鍵詞相關的問答對。??