神經(jīng)網(wǎng)絡(luò)的量化方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN201911420241.0 申請日 -
公開(公告)號 CN111178514A 公開(公告)日 2020-05-19
申請公布號 CN111178514A 申請公布日 2020-05-19
分類號 G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 韓璐 申請(專利權(quán))人 翱捷智能科技(上海)有限公司
代理機構(gòu) 上海碩力知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 翱捷智能科技(上海)有限公司
地址 201300 上海市浦東新區(qū)南匯新城鎮(zhèn)環(huán)湖西二路888號C樓
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例提出神經(jīng)網(wǎng)絡(luò)的量化方法及系統(tǒng),其方法包括步驟:(1)獲取神經(jīng)網(wǎng)絡(luò)參數(shù),在原網(wǎng)絡(luò)前向傳播中將卷積層和BN層進(jìn)行融合,以獲得新的待量化權(quán)重和待量化偏置,同時保存每層激活輸出數(shù)據(jù);(2)對融合后獲得的神經(jīng)網(wǎng)絡(luò)參數(shù)和數(shù)據(jù)分布進(jìn)行量化處理;(3)將量化處理后獲得的量化參數(shù)作為量化后新網(wǎng)絡(luò)前向傳播的參數(shù),形成新的量化網(wǎng)絡(luò)。本發(fā)明能夠有效平衡神經(jīng)網(wǎng)絡(luò)量化縮放尺度過大或過小產(chǎn)生的各種問題,在節(jié)約硬件資源的同時,提高運算速度。