一種基于FPGA平臺的深度學(xué)習(xí)模型加速方法
基本信息
申請?zhí)?/td> | CN201910400924.3 | 申請日 | - |
公開(公告)號 | CN110084363A | 公開(公告)日 | 2019-08-02 |
申請公布號 | CN110084363A | 申請公布日 | 2019-08-02 |
分類號 | G06N3/063(2006.01)I; G06F12/0895(2016.01)I; G06F12/02(2006.01)I; G06F9/38(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 閔銳; 王潔磊 | 申請(專利權(quán))人 | 電科瑞達(成都)科技有限公司 |
代理機構(gòu) | 成都點睛專利代理事務(wù)所(普通合伙) | 代理人 | 孫一峰 |
地址 | 610041 四川省成都市高新區(qū)高朋大道21號1幢5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于FPGA平臺的深度學(xué)習(xí)模型加速方法。本發(fā)明在硬件平臺設(shè)計上采用流式架構(gòu),通過將訓(xùn)練好的模型參數(shù)加載到FPGA片上內(nèi)存,利用其可編程的硬件特性實現(xiàn)模型推理加速。在模型移植過程中,本發(fā)明從數(shù)據(jù)傳輸、數(shù)據(jù)存儲訪問、數(shù)據(jù)處理流程和卷積計算四個方面分別進行優(yōu)化,使得系統(tǒng)可以充分利用FPGA的并發(fā)優(yōu)勢,并可以針對不同F(xiàn)PGA平臺的資源特點選擇優(yōu)化參數(shù),充分利用其豐富的片上資源,實現(xiàn)模型推理的加速。本發(fā)明在僅損失原模型很小的精度的情況下,實現(xiàn)了同等功耗下系統(tǒng)吞吐量的成倍提升,具備將深度學(xué)習(xí)模型大規(guī)模部署到資源受限場景中的能力。 |
