基于溫習(xí)機(jī)制的知識(shí)蒸餾方法、裝置、計(jì)算機(jī)設(shè)備和介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110495734.1 申請(qǐng)日 -
公開(公告)號(hào) CN113240120A 公開(公告)日 2021-08-10
申請(qǐng)公布號(hào) CN113240120A 申請(qǐng)公布日 2021-08-10
分類號(hào) G06N5/02(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06K9/00(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳鵬光;劉樞;賈佳亞;沈小勇;呂江波 申請(qǐng)(專利權(quán))人 深圳思謀信息科技有限公司
代理機(jī)構(gòu) 廣州華進(jìn)聯(lián)合專利商標(biāo)代理有限公司 代理人 蔡抒楓
地址 518051廣東省深圳市南山區(qū)高新南九道45號(hào)三航科技大廈22樓
法律狀態(tài) -

摘要

摘要 本申請(qǐng)涉及一種基于溫習(xí)機(jī)制的知識(shí)蒸餾方法、裝置、計(jì)算機(jī)設(shè)備和存儲(chǔ)介質(zhì)。本申請(qǐng)能夠?qū)⒔處熅W(wǎng)絡(luò)不同階段之間的信息都能傳遞至學(xué)生網(wǎng)絡(luò),進(jìn)而提高知識(shí)蒸餾的效果,提高分類準(zhǔn)確度。該方法包括:獲取訓(xùn)練數(shù)據(jù);將訓(xùn)練數(shù)據(jù)輸入至教師網(wǎng)絡(luò),得到教師網(wǎng)絡(luò)的各中間層的輸出特征,以及將訓(xùn)練數(shù)據(jù)輸入至學(xué)生網(wǎng)絡(luò),得到學(xué)生網(wǎng)絡(luò)輸出的學(xué)生網(wǎng)絡(luò)預(yù)測(cè)結(jié)果和學(xué)生網(wǎng)絡(luò)的各中間層的輸出特征;根據(jù)學(xué)生網(wǎng)絡(luò)中各中間層的輸出特征與教師網(wǎng)絡(luò)中各中間層的輸出特征的距離的累加確定蒸餾損失部分;根據(jù)學(xué)生網(wǎng)絡(luò)預(yù)測(cè)結(jié)果確定基礎(chǔ)損失部分;基于蒸餾損失部分和基礎(chǔ)損失部分,對(duì)學(xué)生網(wǎng)絡(luò)進(jìn)行訓(xùn)練。