一種神經(jīng)網(wǎng)絡(luò)模型的量化方法及裝置

基本信息

申請?zhí)?/td> CN202010290732.4 申請日 -
公開(公告)號 CN111563589A 公開(公告)日 2020-08-21
申請公布號 CN111563589A 申請公布日 2020-08-21
分類號 G06N3/08(2006.01)I 分類 -
發(fā)明人 梁寬濤 申請(專利權(quán))人 中科物棲(北京)科技有限責(zé)任公司
代理機(jī)構(gòu) 北京和信華成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 胡劍輝
地址 100086北京市海淀區(qū)科學(xué)院南路6號中國科學(xué)院計算技術(shù)研究所科研綜合樓12層1248室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例涉及一種神經(jīng)網(wǎng)絡(luò)模型的量化方法及裝置,所述方法包括:在第一約束條件下確定神經(jīng)網(wǎng)絡(luò)模型每一層的第一量化位寬,第一約束條件依賴指定的電阻隨機(jī)存取存儲器ReRAM加速器的資源設(shè)置;針對神經(jīng)網(wǎng)絡(luò)模型的每一層,依據(jù)該層的第一量化位寬對該層的權(quán)重進(jìn)行量化并將量化結(jié)果映射至ReRAM加速器,以及依據(jù)映射結(jié)果確定該層對應(yīng)的第二約束條件;針對神經(jīng)網(wǎng)絡(luò)模型的每一層,對該層中的權(quán)重進(jìn)行分塊,針對每一分塊,在該層對應(yīng)的第二約束條件下確定該分塊的第二量化位寬,并依據(jù)第二量化位寬對該分塊中的權(quán)重進(jìn)行量化。由此,可以實現(xiàn)最終確定出的量化方案既可以使得ReRAM加速器的資源利用率最高,又可以使得量化之后的神經(jīng)網(wǎng)絡(luò)模型的精度最高。??