一種神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法
基本信息
申請?zhí)?/td> | CN201911076765.2 | 申請日 | - |
公開(公告)號 | CN110889204A | 公開(公告)日 | 2020-03-17 |
申請公布號 | CN110889204A | 申請公布日 | 2020-03-17 |
分類號 | G06F30/20;G06N3/04 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 鄭勇;陳柱佳;舒毅 | 申請(專利權(quán))人 | 北京中科勝芯科技有限公司 |
代理機(jī)構(gòu) | 南京行高知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 北京中科勝芯科技有限公司 |
地址 | 100043 北京市石景山區(qū)石景山路54號院6號樓4層403-14 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法,包括:包括剪枝和歸一化的線性量化。本發(fā)明提供的神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法,改進(jìn)傳統(tǒng)的線性量化方法,解決了傳統(tǒng)線性量化方法所引入的梯度消失問題。結(jié)合硬件友好的剪枝方法深度壓縮神經(jīng)網(wǎng)絡(luò),避免不規(guī)則的稀疏結(jié)構(gòu)所帶來的一系列弊端,并完全消除用于記錄非零值位置信息的指針開銷問題,從而有效提高深度學(xué)習(xí)處理器的能效。 |
