一種基于TVM的NPU神經(jīng)網(wǎng)絡模型部署方法及裝置
基本信息
申請?zhí)?/td> | CN202210482702.2 | 申請日 | - |
公開(公告)號 | CN114721670A | 公開(公告)日 | 2022-07-08 |
申請公布號 | CN114721670A | 申請公布日 | 2022-07-08 |
分類號 | G06F8/60(2018.01)I;G06F8/41(2018.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06N3/063(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 賈豐榮;蔡萬偉;陳寧 | 申請(專利權)人 | 深圳云天勵飛技術股份有限公司 |
代理機構 | 北京三聚陽光知識產(chǎn)權代理有限公司 | 代理人 | - |
地址 | 518000廣東省深圳市龍崗區(qū)園山街道龍崗大道8288號深圳大運軟件小鎮(zhèn)17棟1樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N基于TVM的NPU神經(jīng)網(wǎng)絡模型部署方法及裝置,包括:獲取待部署的神經(jīng)網(wǎng)絡模型和當前NPU的硬件屬性信息;根據(jù)神經(jīng)網(wǎng)絡模型的計算邏輯,確定待部署到當前NPU的卷積算子;根據(jù)當前NPU的硬件屬性信息和各卷積算子的參數(shù)信息,確定各卷積算子在當前NPU中的最優(yōu)參數(shù)配置;根據(jù)最優(yōu)參數(shù)配置和當前NPU的硬件屬性信息,調(diào)整tir層的數(shù)據(jù)布局和卷積權重,對relay層的參數(shù)進行修改,得到適配當前NPU的目標TVM;基于目標TVM,生成神經(jīng)網(wǎng)絡模型適用于當前NPU的部署文件。通過對TVM的tir層和relay層進行相應的參數(shù)調(diào)整,以使得到的目標TVM能夠適配該NPU。 |
