多精度神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)方法及系統(tǒng)
基本信息
申請?zhí)?/td> | CN202110753398.6 | 申請日 | - |
公開(公告)號 | CN113469349A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113469349A | 申請公布日 | 2021-10-01 |
分類號 | G06N3/063(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 鮑丹;季圣潔;沈沙 | 申請(專利權(quán))人 | 合肥酷芯微電子有限公司 |
代理機構(gòu) | 上海段和段律師事務(wù)所 | 代理人 | 黃磊;郭國中 |
地址 | 200082上海市楊浦區(qū)淞滬路308號501室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種多精度神經(jīng)網(wǎng)絡(luò)模型實現(xiàn)方法及系統(tǒng),包括:獲取硬件加速器的算子約束條件,生成多精度神經(jīng)網(wǎng)絡(luò)模型的計算圖算子配置信息;對多精度神經(jīng)網(wǎng)絡(luò)模型進行結(jié)構(gòu)分析,結(jié)合計算圖算子配置信息得到不同數(shù)值精度與計算圖算子的對應(yīng)關(guān)系;根據(jù)不同數(shù)值精度與計算圖算子的對應(yīng)關(guān)系,對多精度神經(jīng)網(wǎng)絡(luò)模型的參數(shù)進行調(diào)整,獲取多精度神經(jīng)網(wǎng)絡(luò)模型在降低數(shù)值精度后的性能補償;根據(jù)參數(shù)調(diào)整后的多精度神經(jīng)網(wǎng)絡(luò)模型,產(chǎn)生各層次配置信息,根據(jù)各層次配置信息將多精度神經(jīng)網(wǎng)絡(luò)模型部署到硬件加速器。本發(fā)明在將復(fù)雜神經(jīng)網(wǎng)絡(luò)部署到特定硬件加速器時,保證算子采用不同的數(shù)值精度組合,以獲得優(yōu)化的功耗、效率和存儲帶寬,降低模型部署難度。 |
