一種基于FPGA平臺的深度學(xué)習(xí)模型加速方法

基本信息

申請?zhí)?/td> CN201910400924.3 申請日 -
公開(公告)號 CN110084363A 公開(公告)日 2019-08-02
申請公布號 CN110084363A 申請公布日 2019-08-02
分類號 G06N3/063(2006.01)I; G06F12/0895(2016.01)I; G06F12/02(2006.01)I; G06F9/38(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 閔銳; 王潔磊 申請(專利權(quán))人 電科瑞達(成都)科技有限公司
代理機構(gòu) 成都點睛專利代理事務(wù)所(普通合伙) 代理人 孫一峰
地址 610041 四川省成都市高新區(qū)高朋大道21號1幢5層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于FPGA平臺的深度學(xué)習(xí)模型加速方法。本發(fā)明在硬件平臺設(shè)計上采用流式架構(gòu),通過將訓(xùn)練好的模型參數(shù)加載到FPGA片上內(nèi)存,利用其可編程的硬件特性實現(xiàn)模型推理加速。在模型移植過程中,本發(fā)明從數(shù)據(jù)傳輸、數(shù)據(jù)存儲訪問、數(shù)據(jù)處理流程和卷積計算四個方面分別進行優(yōu)化,使得系統(tǒng)可以充分利用FPGA的并發(fā)優(yōu)勢,并可以針對不同F(xiàn)PGA平臺的資源特點選擇優(yōu)化參數(shù),充分利用其豐富的片上資源,實現(xiàn)模型推理的加速。本發(fā)明在僅損失原模型很小的精度的情況下,實現(xiàn)了同等功耗下系統(tǒng)吞吐量的成倍提升,具備將深度學(xué)習(xí)模型大規(guī)模部署到資源受限場景中的能力。