機(jī)器閱讀理解以及減少候選數(shù)據(jù)集規(guī)模的方法、裝置

基本信息

申請?zhí)?/td> CN201810812763.4 申請日 -
公開(公告)號(hào) CN109255012B 公開(公告)日 2021-04-30
申請公布號(hào) CN109255012B 申請公布日 2021-04-30
分類號(hào) G06F16/33 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 楊志明;時(shí)迎成 申請(專利權(quán))人 深思考人工智能機(jī)器人科技(北京)有限公司
代理機(jī)構(gòu) 北京德琦知識(shí)產(chǎn)權(quán)代理有限公司 代理人 謝安昆;宋志強(qiáng)
地址 100085 北京市海淀區(qū)上地信息路12號(hào)中關(guān)村發(fā)展大廈B區(qū)B203
法律狀態(tài) -

摘要

摘要 公開了機(jī)器閱讀理解的實(shí)現(xiàn)方法,根據(jù)問題類型過濾第一數(shù)據(jù)集合得到過濾后的第二數(shù)據(jù)集合;將問題與第二數(shù)據(jù)集合中的數(shù)據(jù)i進(jìn)行語義匹配,得數(shù)據(jù)i的語義匹配得分;將問題與所述數(shù)據(jù)i進(jìn)行最大覆蓋度計(jì)算得到數(shù)據(jù)i的特征匹配得分;加權(quán)所述數(shù)據(jù)i的語義匹配得分和特征匹配得分得到問題與數(shù)據(jù)i的匹配得分;對(duì)數(shù)據(jù)i按照多文檔投票算法計(jì)算數(shù)據(jù)i的投票得分,根據(jù)數(shù)據(jù)i的匹配得分和投票得分,計(jì)算出數(shù)據(jù)i的最終得分;按照最終得分的降序選擇序列中前n個(gè)數(shù)據(jù),作為候選數(shù)據(jù)集;將所述候選數(shù)據(jù)集輸入基線模型,基于基線模型對(duì)輸入數(shù)據(jù)集進(jìn)行答案預(yù)測,得到所述問題的候選答案集。本申請實(shí)現(xiàn)了對(duì)數(shù)據(jù)集合的排序,對(duì)問題抽取出有效地答案。