一種基于關鍵詞的長文本問答對生成系統
基本信息
申請?zhí)?/td> | CN202010670132.0 | 申請日 | - |
公開(公告)號 | CN111914062A | 公開(公告)日 | 2020-11-10 |
申請公布號 | CN111914062A | 申請公布日 | 2020-11-10 |
分類號 | G06F16/33(2019.01)I | 分類 | 計算;推算;計數; |
發(fā)明人 | 朱其立;沈李斌;張盛瑤;郭子路;李愷健;奚寧;李波 | 申請(專利權)人 | 上海樂言科技股份有限公司 |
代理機構 | 上海專利商標事務所有限公司 | 代理人 | 施浩 |
地址 | 200050 上海市長寧區(qū)長寧路1033號聯通大廈19樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了基于關鍵詞的長文本問答對生成系統,實現根據文本及關鍵詞生成與關鍵詞相關且有意義的問答對。其技術方案為:系統包括生成模塊和評估模塊,生成模塊針對段落及關鍵詞生成與關鍵詞相關的問答對,評估模塊通過自動評估方式評價問答對質量。生成模塊基于三階段生成模型生成問答對:依次串聯的段落檢索單元、答案范圍提取單元以及問題生成單元。其中段落檢索單元用于基于信息檢索模型,根據關鍵詞從文本中檢索出候選問答對在長文本中所處的候選段落;答案范圍提取單元用于從候選段落中提取出可能存在的答案范圍;問題生成單元根據候選段落和答案范圍中的其中一個答案,生成問題并和答案組成與關鍵詞相關的問答對。?? |
