一種神經(jīng)網(wǎng)絡(luò)模型的量化方法及裝置
基本信息
申請?zhí)?/td> | CN202010290732.4 | 申請日 | - |
公開(公告)號 | CN111563589A | 公開(公告)日 | 2020-08-21 |
申請公布號 | CN111563589A | 申請公布日 | 2020-08-21 |
分類號 | G06N3/08(2006.01)I | 分類 | - |
發(fā)明人 | 梁寬濤 | 申請(專利權(quán))人 | 中科物棲(北京)科技有限責(zé)任公司 |
代理機(jī)構(gòu) | 北京和信華成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 胡劍輝 |
地址 | 100086北京市海淀區(qū)科學(xué)院南路6號中國科學(xué)院計算技術(shù)研究所科研綜合樓12層1248室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實施例涉及一種神經(jīng)網(wǎng)絡(luò)模型的量化方法及裝置,所述方法包括:在第一約束條件下確定神經(jīng)網(wǎng)絡(luò)模型每一層的第一量化位寬,第一約束條件依賴指定的電阻隨機(jī)存取存儲器ReRAM加速器的資源設(shè)置;針對神經(jīng)網(wǎng)絡(luò)模型的每一層,依據(jù)該層的第一量化位寬對該層的權(quán)重進(jìn)行量化并將量化結(jié)果映射至ReRAM加速器,以及依據(jù)映射結(jié)果確定該層對應(yīng)的第二約束條件;針對神經(jīng)網(wǎng)絡(luò)模型的每一層,對該層中的權(quán)重進(jìn)行分塊,針對每一分塊,在該層對應(yīng)的第二約束條件下確定該分塊的第二量化位寬,并依據(jù)第二量化位寬對該分塊中的權(quán)重進(jìn)行量化。由此,可以實現(xiàn)最終確定出的量化方案既可以使得ReRAM加速器的資源利用率最高,又可以使得量化之后的神經(jīng)網(wǎng)絡(luò)模型的精度最高。?? |
