神經(jīng)網(wǎng)絡(luò)模型的量化方法、裝置和系統(tǒng)、電子設(shè)備和存儲(chǔ)介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202111153963.1 申請(qǐng)日 -
公開(公告)號(hào) CN113902114A 公開(公告)日 2022-01-07
申請(qǐng)公布號(hào) CN113902114A 申請(qǐng)公布日 2022-01-07
分類號(hào) G06N3/08(2006.01)I;G06N3/063(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 袁之航;陳亮;趙亦彤;王輝;吳強(qiáng) 申請(qǐng)(專利權(quán))人 南京后摩智能科技有限公司
代理機(jī)構(gòu) 北京思源智匯知識(shí)產(chǎn)權(quán)代理有限公司 代理人 毛麗琴
地址 210046江蘇省南京市棲霞區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)興智路6號(hào)興智科技園C棟第18層1807室
法律狀態(tài) -

摘要

摘要 本公開實(shí)施例公開了一種神經(jīng)網(wǎng)絡(luò)模型的量化方法、裝置和系統(tǒng)、電子設(shè)備和介質(zhì),其中,方法包括:分別針對(duì)待量化神經(jīng)網(wǎng)絡(luò)模型中的任一待量化網(wǎng)絡(luò)層,獲取所述任一待量化網(wǎng)絡(luò)層的權(quán)重矩陣;對(duì)所述任一待量化網(wǎng)絡(luò)層的權(quán)重矩陣進(jìn)行矩陣變換,得到所述任一待量化網(wǎng)絡(luò)層的待量化權(quán)重矩陣;對(duì)所述任一待量化網(wǎng)絡(luò)層的待量化權(quán)重矩陣進(jìn)行量化,得到所述任一待量化網(wǎng)絡(luò)層的量化后權(quán)重矩陣;基于所述待量化神經(jīng)網(wǎng)絡(luò)模型中的任一待量化網(wǎng)絡(luò)層的量化后權(quán)重矩陣,得到量化后神經(jīng)網(wǎng)絡(luò)模型。本公開實(shí)施例可以降低權(quán)重矩陣中各通道的權(quán)重?cái)?shù)據(jù)的分布差異,能夠減少量化誤差,有助于提升量化后神經(jīng)網(wǎng)絡(luò)的精度。