具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法

基本信息

申請(qǐng)?zhí)?/td> CN202110137698.1 申請(qǐng)日 -
公開(公告)號(hào) CN112818101A 公開(公告)日 2021-05-18
申請(qǐng)公布號(hào) CN112818101A 申請(qǐng)公布日 2021-05-18
分類號(hào) G06F16/332;G06F16/335;G06N20/00 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張鳴;王海濤;詹威;王勤勤;汪鵬;吳凱;石克陽(yáng) 申請(qǐng)(專利權(quán))人 杭州微洱網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 杭州裕陽(yáng)聯(lián)合專利代理有限公司 代理人 張解翠
地址 311121 浙江省杭州市余杭區(qū)倉(cāng)前街道文一西路1382號(hào)601-5
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法,包括以下步驟:通過模型A接收用戶輸入的若干問題并針對(duì)該若干問題分別輸出相對(duì)應(yīng)的答案;將用戶輸入的若干問題中的每個(gè)問題和其對(duì)應(yīng)的答案組成問答對(duì);通過模型B對(duì)若干問答對(duì)進(jìn)行打分;通過打分后的若干問答對(duì)對(duì)模型A進(jìn)行增量學(xué)習(xí)。本發(fā)明提供的具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法能夠通過強(qiáng)化學(xué)習(xí)自動(dòng)訓(xùn)練調(diào)整更新模型A,實(shí)現(xiàn)模型A的持續(xù)性自我微調(diào)、自我完善以及自我學(xué)習(xí),這樣既能夠優(yōu)化針對(duì)問題輸出的答案,有能夠節(jié)省大量人工標(biāo)注,節(jié)省勞動(dòng)力成本。