一種減少移動設備存儲空間消耗以及計算量的方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201810460805.2 | 申請日 | - |
公開(公告)號 | CN108764458B | 公開(公告)日 | 2021-03-02 |
申請公布號 | CN108764458B | 申請公布日 | 2021-03-02 |
分類號 | G06N3/04(2006.01)I;G06F16/28(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 李明;彭志諜 | 申請(專利權(quán))人 | 武漢環(huán)宇智行科技有限公司 |
代理機構(gòu) | 武漢智嘉聯(lián)合知識產(chǎn)權(quán)代理事務所(普通合伙) | 代理人 | 黃君軍 |
地址 | 430000湖北省武漢市洪山區(qū)文化大道555號融科智谷A2棟305號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種非均勻量化的模型壓縮方法及系統(tǒng),首先對卷積神經(jīng)網(wǎng)絡的權(quán)值進行聚類,將每個簇里的權(quán)值量化為該簇中心點的值,計算每一簇中所有權(quán)值量化后的量化誤差總和,當一簇的量化誤差總和大于預設閾值時,將該簇以等間隔劃分區(qū)間的方式進行再次量化,以減小權(quán)值量化的誤差;對權(quán)值的量化采用的是非均勻量化的方法,不光使權(quán)值的數(shù)量和存儲空間減少,神經(jīng)網(wǎng)絡整體的量化誤差將會更小,整體網(wǎng)絡的精度基本不會有損失;用量化階索引存儲量化后的權(quán)值可減少權(quán)值的存儲空間;將量化后的權(quán)值和卷積神經(jīng)網(wǎng)絡的輸入數(shù)據(jù)定點化,使卷積神經(jīng)網(wǎng)絡模型的計算速度和計算效率得到了顯著提高。?? |
