一種基于熵注意的神經(jīng)網(wǎng)絡模型壓縮與加速方法

基本信息

申請?zhí)?/td> CN201910400927.7 申請日 -
公開(公告)號 CN110097178A 公開(公告)日 2019-08-06
申請公布號 CN110097178A 申請公布日 2019-08-06
分類號 G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 閔銳;蔣霆 申請(專利權(quán))人 電科瑞達(成都)科技有限公司
代理機構(gòu) 成都點睛專利代理事務所(普通合伙) 代理人 孫一峰
地址 610041 四川省成都市高新區(qū)高朋大道21號1幢5層
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于神經(jīng)網(wǎng)絡技術(shù)領域,涉及一種基于熵注意的神經(jīng)網(wǎng)絡模型壓縮與加速方法。本發(fā)明通過構(gòu)建一個參數(shù)量大,計算量大且性能優(yōu)越的教師網(wǎng)絡模型來對一個參數(shù)量少、計算量少且性能欠佳的學生網(wǎng)絡的強監(jiān)督學習,通過該學習過程,最終得到了一個參數(shù)量少、計算量少且性能優(yōu)越的小模型,該小模型能夠滿足現(xiàn)實場景的實時性以及精度要求。