問答模型的訓(xùn)練方法、計(jì)算機(jī)設(shè)備以及可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202010388307.9 | 申請日 | - |
公開(公告)號 | CN111737426B | 公開(公告)日 | 2021-06-01 |
申請公布號 | CN111737426B | 申請公布日 | 2021-06-01 |
分類號 | G06N3/04(2006.01)I;G06F16/33(2019.01)I;G06N3/08(2006.01)I;G06F16/332(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 黃薇屹;楊敏;曲強(qiáng);姜青山;賀倩明 | 申請(專利權(quán))人 | 深圳得理科技有限公司 |
代理機(jī)構(gòu) | 深圳市威世博知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 黎堅(jiān)怡 |
地址 | 518055廣東省深圳市南山區(qū)深圳大學(xué)城學(xué)苑大道1068號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了問答模型的訓(xùn)練方法、計(jì)算機(jī)設(shè)備以及計(jì)算機(jī)可讀存儲介質(zhì)。該問答模型的訓(xùn)練方法包括:建立文本匹配模型和元學(xué)習(xí)模型,文本匹配模型和元學(xué)習(xí)模型具有相同的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);獲取測試任務(wù)和多個不同的訓(xùn)練任務(wù);分別基于多個不同的訓(xùn)練任務(wù)各自的第一匹配損失來更新元學(xué)習(xí)模型的元網(wǎng)絡(luò)參數(shù),第一匹配損失用于表示多個不同的訓(xùn)練任務(wù)各自的文本匹配模型的匹配誤差;利用更新后的元網(wǎng)絡(luò)參數(shù)生成文本匹配模型的初始參數(shù),并使用測試任務(wù)對文本匹配模型進(jìn)行訓(xùn)練以更新文本匹配模型的初始參數(shù),將經(jīng)過訓(xùn)練后所得到的文本匹配模型作為問答模型。通過上述方式,本申請的問答模型能夠應(yīng)用于少樣本的問答領(lǐng)域中,并提高問答對匹配的準(zhǔn)確性。?? |
