用于輕量化神經(jīng)網(wǎng)絡的結構化剪枝方法、裝置、介質及設備

基本信息

申請?zhí)?/td> CN202011107507.9 申請日 -
公開(公告)號 CN112241789A 公開(公告)日 2021-01-19
申請公布號 CN112241789A 申請公布日 2021-01-19
分類號 G06N3/08;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 姚志強;周曦;李連強;梁俊文 申請(專利權)人 廣州云從凱風科技有限公司
代理機構 上海光華專利事務所(普通合伙) 代理人 代玲
地址 511458 廣東省廣州市南沙區(qū)金隆路26號1009房(僅限辦公用途)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種用于輕量化神經(jīng)網(wǎng)絡的結構化剪枝方法,包括:根據(jù)神經(jīng)網(wǎng)絡中待剪枝的目標層中的三維張量Filter構建相似度矩陣;基于譜聚類對所述相似度矩陣對應的三維張量Filter進行聚類,得到多個聚類簇;確定每個聚類簇的質心以及同一聚類簇中每個三維張量Filer與所述質心的距離;刪除與質心距離超過設定閾值對應的三維張量Filter,得到目標神經(jīng)網(wǎng)絡模型。本發(fā)明作為結構化剪枝方法,經(jīng)過結構化剪枝后的神經(jīng)網(wǎng)絡的權值矩陣之間不存在非結構化稀疏現(xiàn)象,可以直接利用現(xiàn)有的軟硬件進行加速,且可以很自然的與其它輕量化神經(jīng)網(wǎng)絡技術,如知識蒸餾、權值量化等聯(lián)合使用以進一步減少網(wǎng)絡冗余。