一種基于熵注意的神經(jīng)網(wǎng)絡(luò)模型壓縮與加速方法
基本信息
申請(qǐng)?zhí)?/td> | CN201910400927.7 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN110097178A | 公開(kāi)(公告)日 | 2019-08-06 |
申請(qǐng)公布號(hào) | CN110097178A | 申請(qǐng)公布日 | 2019-08-06 |
分類號(hào) | G06N3/04;G06N3/08 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 閔銳;蔣霆 | 申請(qǐng)(專利權(quán))人 | 電科瑞達(dá)(成都)科技有限公司 |
代理機(jī)構(gòu) | 成都點(diǎn)睛專利代理事務(wù)所(普通合伙) | 代理人 | 孫一峰 |
地址 | 610041 四川省成都市高新區(qū)高朋大道21號(hào)1幢5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于神經(jīng)網(wǎng)絡(luò)技術(shù)領(lǐng)域,涉及一種基于熵注意的神經(jīng)網(wǎng)絡(luò)模型壓縮與加速方法。本發(fā)明通過(guò)構(gòu)建一個(gè)參數(shù)量大,計(jì)算量大且性能優(yōu)越的教師網(wǎng)絡(luò)模型來(lái)對(duì)一個(gè)參數(shù)量少、計(jì)算量少且性能欠佳的學(xué)生網(wǎng)絡(luò)的強(qiáng)監(jiān)督學(xué)習(xí),通過(guò)該學(xué)習(xí)過(guò)程,最終得到了一個(gè)參數(shù)量少、計(jì)算量少且性能優(yōu)越的小模型,該小模型能夠滿足現(xiàn)實(shí)場(chǎng)景的實(shí)時(shí)性以及精度要求。 |
