問(wèn)答模型的訓(xùn)練方法、計(jì)算機(jī)設(shè)備以及可讀存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202010388307.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111737426A 公開(kāi)(公告)日 2021-06-01
申請(qǐng)公布號(hào) CN111737426A 申請(qǐng)公布日 2021-06-01
分類(lèi)號(hào) G06F16/332;G06F16/33;G06N3/04;G06N3/08 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃薇屹;楊敏;曲強(qiáng);姜青山;賀倩明 申請(qǐng)(專(zhuān)利權(quán))人 深圳得理科技有限公司
代理機(jī)構(gòu) 深圳市威世博知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 黎堅(jiān)怡
地址 518055 廣東省深圳市南山區(qū)深圳大學(xué)城學(xué)苑大道1068號(hào)
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了問(wèn)答模型的訓(xùn)練方法、計(jì)算機(jī)設(shè)備以及計(jì)算機(jī)可讀存儲(chǔ)介質(zhì)。該問(wèn)答模型的訓(xùn)練方法包括:建立文本匹配模型和元學(xué)習(xí)模型,文本匹配模型和元學(xué)習(xí)模型具有相同的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu);獲取測(cè)試任務(wù)和多個(gè)不同的訓(xùn)練任務(wù);分別基于多個(gè)不同的訓(xùn)練任務(wù)各自的第一匹配損失來(lái)更新元學(xué)習(xí)模型的元網(wǎng)絡(luò)參數(shù),第一匹配損失用于表示多個(gè)不同的訓(xùn)練任務(wù)各自的文本匹配模型的匹配誤差;利用更新后的元網(wǎng)絡(luò)參數(shù)生成文本匹配模型的初始參數(shù),并使用測(cè)試任務(wù)對(duì)文本匹配模型進(jìn)行訓(xùn)練以更新文本匹配模型的初始參數(shù),將經(jīng)過(guò)訓(xùn)練后所得到的文本匹配模型作為問(wèn)答模型。通過(guò)上述方式,本申請(qǐng)的問(wèn)答模型能夠應(yīng)用于少樣本的問(wèn)答領(lǐng)域中,并提高問(wèn)答對(duì)匹配的準(zhǔn)確性。