模型加速方法、裝置、集成電路和存儲(chǔ)介質(zhì)
基本信息
申請(qǐng)?zhí)?/td> | CN202210586618.5 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114676827A | 公開(kāi)(公告)日 | 2022-06-28 |
申請(qǐng)公布號(hào) | CN114676827A | 申請(qǐng)公布日 | 2022-06-28 |
分類(lèi)號(hào) | G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 張斌;沈小勇;呂江波 | 申請(qǐng)(專(zhuān)利權(quán))人 | 蘇州思謀智能科技有限公司 |
代理機(jī)構(gòu) | 華進(jìn)聯(lián)合專(zhuān)利商標(biāo)代理有限公司 | 代理人 | - |
地址 | 518051廣東省深圳市南山區(qū)高新南九道45號(hào)三航科技大廈22樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)涉及一種模型加速方法、裝置、集成電路、存儲(chǔ)介質(zhì)和計(jì)算機(jī)程序產(chǎn)品。所述方法包括:根據(jù)訓(xùn)練后的待加速模型的激活函數(shù)類(lèi)型,得到與所述訓(xùn)練后的待加速模型相匹配的操作融合方式;所述操作融合方式表示所述訓(xùn)練后的待加速模型的卷積、激活和量化操作的融合方式;根據(jù)所述訓(xùn)練后的待加速模型的操作融合方式,對(duì)所述訓(xùn)練后的待加速模型的卷積參數(shù)、激活系數(shù)和量化參數(shù)進(jìn)行融合運(yùn)算,得到所述卷積參數(shù)、所述激活系數(shù)和所述量化參數(shù)的融合結(jié)果;根據(jù)所述融合結(jié)果,對(duì)輸入到所述訓(xùn)練后的待加速模型中的卷積數(shù)據(jù)進(jìn)行推理加速,得到所述卷積數(shù)據(jù)的推理加速結(jié)果。采用本方法能夠提升深度神經(jīng)網(wǎng)絡(luò)的推理效率。 |
