模型訓(xùn)練方法及裝置、存儲介質(zhì)、計算設(shè)備
基本信息
申請?zhí)?/td> | CN202011415641.5 | 申請日 | - |
公開(公告)號 | CN112784677A | 公開(公告)日 | 2021-05-11 |
申請公布號 | CN112784677A | 申請公布日 | 2021-05-11 |
分類號 | G06K9/00;G06K9/62;G06N3/08;G06N3/04 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 段魁;蔡濤;陳新澤;黃冠;都大龍 | 申請(專利權(quán))人 | 上海芯翌智能科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 張振軍 |
地址 | 200434 上海市虹口區(qū)水電路1388號10層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種模型訓(xùn)練方法及裝置、存儲介質(zhì)、計算設(shè)備,模型訓(xùn)練方法包括:將訓(xùn)練數(shù)據(jù)輸入至構(gòu)建好的基準(zhǔn)模型和老師模型,基準(zhǔn)模型的網(wǎng)絡(luò)層數(shù)小于老師模型的網(wǎng)絡(luò)層數(shù);獲取基準(zhǔn)模型針對訓(xùn)練數(shù)據(jù)的第一輸出結(jié)果和老師模型針對訓(xùn)練數(shù)據(jù)的第二輸出結(jié)果;基于每一類別的第一分類概率生成非該類別的第三分類概率,以及基于每一類別第二分類概率生成非該類別的第四分類概率;利用每一類別下的第一概率分布和第二概率分布計算KL散度,以及計算基準(zhǔn)模型自身的誤差;利用KL散度以及基準(zhǔn)模型自身的誤差在基準(zhǔn)模型中進(jìn)行反向傳播,以用于調(diào)整基準(zhǔn)模型的網(wǎng)絡(luò)參數(shù)。本發(fā)明技術(shù)方案能夠提升模型分類效果的準(zhǔn)確性和實(shí)時性。 |
