一種減少移動設備存儲空間消耗以及計算量的方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201810460805.2 申請日 -
公開(公告)號 CN108764458B 公開(公告)日 2021-03-02
申請公布號 CN108764458B 申請公布日 2021-03-02
分類號 G06N3/04(2006.01)I;G06F16/28(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 李明;彭志諜 申請(專利權(quán))人 武漢環(huán)宇智行科技有限公司
代理機構(gòu) 武漢智嘉聯(lián)合知識產(chǎn)權(quán)代理事務所(普通合伙) 代理人 黃君軍
地址 430000湖北省武漢市洪山區(qū)文化大道555號融科智谷A2棟305號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種非均勻量化的模型壓縮方法及系統(tǒng),首先對卷積神經(jīng)網(wǎng)絡的權(quán)值進行聚類,將每個簇里的權(quán)值量化為該簇中心點的值,計算每一簇中所有權(quán)值量化后的量化誤差總和,當一簇的量化誤差總和大于預設閾值時,將該簇以等間隔劃分區(qū)間的方式進行再次量化,以減小權(quán)值量化的誤差;對權(quán)值的量化采用的是非均勻量化的方法,不光使權(quán)值的數(shù)量和存儲空間減少,神經(jīng)網(wǎng)絡整體的量化誤差將會更小,整體網(wǎng)絡的精度基本不會有損失;用量化階索引存儲量化后的權(quán)值可減少權(quán)值的存儲空間;將量化后的權(quán)值和卷積神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)定點化,使卷積神經(jīng)網(wǎng)絡模型的計算速度和計算效率得到了顯著提高。??