基于漸進式量化和Hessian信息的神經(jīng)網(wǎng)絡(luò)混合量化方法

基本信息

申請?zhí)?/td> CN202010915248.6 申請日 -
公開(公告)號 CN112183742A 公開(公告)日 2021-01-05
申請公布號 CN112183742A 申請公布日 2021-01-05
分類號 G06N3/08;G06N3/02 分類 計算;推算;計數(shù);
發(fā)明人 王振寧;許金泉;王溢;蔡碧穎 申請(專利權(quán))人 南強智視(廈門)科技有限公司
代理機構(gòu) 泉州市潭思專利代理事務(wù)所(普通合伙) 代理人 廖仲禧;麻艷
地址 361000 福建省廈門市湖里區(qū)火炬高新區(qū)軟件園創(chuàng)新大廈A區(qū)402
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于漸進式量化和Hessian信息的神經(jīng)網(wǎng)絡(luò)混合量化方法,步驟是:給定圖像?標(biāo)簽對集合,劃分樣本集和校準(zhǔn)集;定義神經(jīng)網(wǎng)絡(luò)每層可選的量化精度范圍;隨機選擇量化層做降bit量化,重復(fù)采樣n次,得到n個基礎(chǔ)的混合精度模型;以校準(zhǔn)集中的圖像?標(biāo)簽對作為輸入,對所有候選的混合精度神經(jīng)網(wǎng)絡(luò)模型進行一次前向過程;利用Adam二階Momentum信息計算Hessian近似值;再計算性能評價指標(biāo),將n個指標(biāo)排序,選擇最小值對應(yīng)混合精度策略作為當(dāng)前步次下性能最好的混合精度超參組合,計算模型的計算成本,再對當(dāng)前的混合精度網(wǎng)絡(luò)模型做訓(xùn)練;迭代至滿足結(jié)束條件。此方法能夠極大地減少每一步次中的可優(yōu)化的混合精度搜索空間,同時提高量化模型的性能評估效率。