一種神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法

基本信息

申請?zhí)?/td> CN201911076765.2 申請日 -
公開(公告)號 CN110889204A 公開(公告)日 2020-03-17
申請公布號 CN110889204A 申請公布日 2020-03-17
分類號 G06F30/20;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭勇;陳柱佳;舒毅 申請(專利權(quán))人 北京中科勝芯科技有限公司
代理機(jī)構(gòu) 南京行高知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京中科勝芯科技有限公司
地址 100043 北京市石景山區(qū)石景山路54號院6號樓4層403-14
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法,包括:包括剪枝和歸一化的線性量化。本發(fā)明提供的神經(jīng)網(wǎng)絡(luò)模型參數(shù)壓縮方法,改進(jìn)傳統(tǒng)的線性量化方法,解決了傳統(tǒng)線性量化方法所引入的梯度消失問題。結(jié)合硬件友好的剪枝方法深度壓縮神經(jīng)網(wǎng)絡(luò),避免不規(guī)則的稀疏結(jié)構(gòu)所帶來的一系列弊端,并完全消除用于記錄非零值位置信息的指針開銷問題,從而有效提高深度學(xué)習(xí)處理器的能效。