神經(jīng)網(wǎng)絡(luò)的量化方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN201911420241.0 | 申請日 | - |
公開(公告)號 | CN111178514A | 公開(公告)日 | 2020-05-19 |
申請公布號 | CN111178514A | 申請公布日 | 2020-05-19 |
分類號 | G06N3/04;G06N3/08 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 韓璐 | 申請(專利權(quán))人 | 翱捷智能科技(上海)有限公司 |
代理機構(gòu) | 上海碩力知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 翱捷智能科技(上海)有限公司 |
地址 | 201300 上海市浦東新區(qū)南匯新城鎮(zhèn)環(huán)湖西二路888號C樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例提出神經(jīng)網(wǎng)絡(luò)的量化方法及系統(tǒng),其方法包括步驟:(1)獲取神經(jīng)網(wǎng)絡(luò)參數(shù),在原網(wǎng)絡(luò)前向傳播中將卷積層和BN層進(jìn)行融合,以獲得新的待量化權(quán)重和待量化偏置,同時保存每層激活輸出數(shù)據(jù);(2)對融合后獲得的神經(jīng)網(wǎng)絡(luò)參數(shù)和數(shù)據(jù)分布進(jìn)行量化處理;(3)將量化處理后獲得的量化參數(shù)作為量化后新網(wǎng)絡(luò)前向傳播的參數(shù),形成新的量化網(wǎng)絡(luò)。本發(fā)明能夠有效平衡神經(jīng)網(wǎng)絡(luò)量化縮放尺度過大或過小產(chǎn)生的各種問題,在節(jié)約硬件資源的同時,提高運算速度。 |
