神經(jīng)網(wǎng)絡(luò)模型的量化方法、裝置和系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202111153963.1 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113902114A | 公開(公告)日 | 2022-01-07 |
申請(qǐng)公布號(hào) | CN113902114A | 申請(qǐng)公布日 | 2022-01-07 |
分類號(hào) | G06N3/08(2006.01)I;G06N3/063(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 袁之航;陳亮;趙亦彤;王輝;吳強(qiáng) | 申請(qǐng)(專利權(quán))人 | 南京后摩智能科技有限公司 |
代理機(jī)構(gòu) | 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 毛麗琴 |
地址 | 210046江蘇省南京市棲霞區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)興智路6號(hào)興智科技園C棟第18層1807室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本公開實(shí)施例公開了一種神經(jīng)網(wǎng)絡(luò)模型的量化方法、裝置和系統(tǒng)、電子設(shè)備和介質(zhì),其中,方法包括:分別針對(duì)待量化神經(jīng)網(wǎng)絡(luò)模型中的任一待量化網(wǎng)絡(luò)層,獲取所述任一待量化網(wǎng)絡(luò)層的權(quán)重矩陣;對(duì)所述任一待量化網(wǎng)絡(luò)層的權(quán)重矩陣進(jìn)行矩陣變換,得到所述任一待量化網(wǎng)絡(luò)層的待量化權(quán)重矩陣;對(duì)所述任一待量化網(wǎng)絡(luò)層的待量化權(quán)重矩陣進(jìn)行量化,得到所述任一待量化網(wǎng)絡(luò)層的量化后權(quán)重矩陣;基于所述待量化神經(jīng)網(wǎng)絡(luò)模型中的任一待量化網(wǎng)絡(luò)層的量化后權(quán)重矩陣,得到量化后神經(jīng)網(wǎng)絡(luò)模型。本公開實(shí)施例可以降低權(quán)重矩陣中各通道的權(quán)重?cái)?shù)據(jù)的分布差異,能夠減少量化誤差,有助于提升量化后神經(jīng)網(wǎng)絡(luò)的精度。 |
