一種神經(jīng)網(wǎng)絡模型壓縮方法及裝置

基本信息

申請?zhí)?/td> CN202010306190.5 申請日 -
公開(公告)號 CN111582471A 公開(公告)日 2020-08-25
申請公布號 CN111582471A 申請公布日 2020-08-25
分類號 G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 -
發(fā)明人 方濟生 申請(專利權)人 中科物棲(北京)科技有限責任公司
代理機構 北京和信華成知識產(chǎn)權代理事務所(普通合伙) 代理人 胡劍輝
地址 100086北京市海淀區(qū)科學院南路6號中國科學院計算技術研究所科研綜合樓12層1248室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例涉及一種神經(jīng)網(wǎng)絡模型壓縮方法及裝置,所述方法包括:對已訓練的神經(jīng)網(wǎng)絡模型中的權重和激活值進行量化;確定量化后的神經(jīng)網(wǎng)絡模型中每一層的位剪枝強度;針對所述量化后的神經(jīng)網(wǎng)絡模型的每一層,基于該層的位剪枝強度對該層中的權重進行剪枝處理;對剪枝處理后的神經(jīng)網(wǎng)絡模型進行重訓練。由此,可以實現(xiàn)充分地降低神經(jīng)網(wǎng)絡模型的位冗余,進一步則可以使得神經(jīng)網(wǎng)絡模型在位串行加速器上具有良好的性能表現(xiàn)。??