一種神經(jīng)網(wǎng)絡(luò)模型交互訓(xùn)練方法、裝置及存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111545139.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN114219078A | 公開(公告)日 | 2022-03-22 |
申請(qǐng)公布號(hào) | CN114219078A | 申請(qǐng)公布日 | 2022-03-22 |
分類號(hào) | G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 喬少華 | 申請(qǐng)(專利權(quán))人 | 武漢中海庭數(shù)據(jù)技術(shù)有限公司 |
代理機(jī)構(gòu) | 武漢藍(lán)寶石專利代理事務(wù)所(特殊普通合伙) | 代理人 | 萬暢 |
地址 | 430000湖北省武漢市東湖新技術(shù)開發(fā)區(qū)軟件園東路1號(hào)軟件園4.1期B6棟1層、9層、10層01室(自貿(mào)區(qū)武漢片區(qū)) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種神經(jīng)網(wǎng)絡(luò)模型交互訓(xùn)練方法及裝置,其方法包括:確定參與交互訓(xùn)練的一個(gè)主神經(jīng)網(wǎng)絡(luò),以及至少一個(gè)次神經(jīng)網(wǎng)絡(luò);根據(jù)所述主神經(jīng)網(wǎng)絡(luò)和次神經(jīng)網(wǎng)絡(luò)之間的分布差異,確定參與交互訓(xùn)練的目標(biāo)函數(shù);根據(jù)所述目標(biāo)函數(shù)訓(xùn)練所述主神經(jīng)網(wǎng)絡(luò)和次神經(jīng)網(wǎng)絡(luò),直至目標(biāo)函數(shù)值達(dá)到閾值且趨于穩(wěn)定,得到訓(xùn)練完成的主神經(jīng)網(wǎng)絡(luò)。本發(fā)明提出一種神經(jīng)網(wǎng)絡(luò)交互訓(xùn)練方法,同時(shí)采用KL散度來度量主網(wǎng)絡(luò)與次網(wǎng)絡(luò)的預(yù)測(cè)概率分布差異,實(shí)現(xiàn)主次網(wǎng)絡(luò)交互學(xué)習(xí)經(jīng)驗(yàn)來引導(dǎo)主網(wǎng)絡(luò)學(xué)習(xí),從而獲得與次網(wǎng)絡(luò)相近或略高的性能,也緩解了主網(wǎng)絡(luò)單獨(dú)訓(xùn)練時(shí)收斂緩慢,容易陷入局部最優(yōu),特別在訓(xùn)練樣本量限制條件下,網(wǎng)絡(luò)模型泛化性較弱,檢出率偏低等問題。 |
