具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110137698.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN112818101A | 公開(公告)日 | 2021-05-18 |
申請(qǐng)公布號(hào) | CN112818101A | 申請(qǐng)公布日 | 2021-05-18 |
分類號(hào) | G06F16/332;G06F16/335;G06N20/00 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張鳴;王海濤;詹威;王勤勤;汪鵬;吳凱;石克陽(yáng) | 申請(qǐng)(專利權(quán))人 | 杭州微洱網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 杭州裕陽(yáng)聯(lián)合專利代理有限公司 | 代理人 | 張解翠 |
地址 | 311121 浙江省杭州市余杭區(qū)倉(cāng)前街道文一西路1382號(hào)601-5 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法,包括以下步驟:通過模型A接收用戶輸入的若干問題并針對(duì)該若干問題分別輸出相對(duì)應(yīng)的答案;將用戶輸入的若干問題中的每個(gè)問題和其對(duì)應(yīng)的答案組成問答對(duì);通過模型B對(duì)若干問答對(duì)進(jìn)行打分;通過打分后的若干問答對(duì)對(duì)模型A進(jìn)行增量學(xué)習(xí)。本發(fā)明提供的具有強(qiáng)化學(xué)習(xí)功能的問答語(yǔ)料學(xué)習(xí)方法能夠通過強(qiáng)化學(xué)習(xí)自動(dòng)訓(xùn)練調(diào)整更新模型A,實(shí)現(xiàn)模型A的持續(xù)性自我微調(diào)、自我完善以及自我學(xué)習(xí),這樣既能夠優(yōu)化針對(duì)問題輸出的答案,有能夠節(jié)省大量人工標(biāo)注,節(jié)省勞動(dòng)力成本。 |
