浮點神經(jīng)網(wǎng)絡(luò)模型量化系統(tǒng)和方法

基本信息

申請?zhí)?/td> CN202011609407.6 申請日 -
公開(公告)號 CN112766484A 公開(公告)日 2021-05-07
申請公布號 CN112766484A 申請公布日 2021-05-07
分類號 G06N3/08(2006.01)I;G06N3/04(2006.01)I 分類 -
發(fā)明人 陳家麒;黃宇揚;馮建豪 申請(專利權(quán))人 上海熠知電子科技有限公司
代理機構(gòu) 上海智晟知識產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 張東梅
地址 200060上海市普陀區(qū)中山北路3000號4508室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種浮點神經(jīng)網(wǎng)絡(luò)模型的量化系統(tǒng),包括:組合校準算法單元,所述組合校準算法單元包括多種校準算法單元,組合校準算法單元為各個浮點神經(jīng)網(wǎng)絡(luò)模型或者一個浮點神經(jīng)網(wǎng)絡(luò)模型中的各個激活值分配不同的校準算法,以便獲得量化參數(shù),并對浮點神經(jīng)網(wǎng)絡(luò)進行量化,得到定點神經(jīng)網(wǎng)絡(luò)模型;自檢優(yōu)化單元,所述自檢優(yōu)化單元在校準數(shù)據(jù)集的一個子集上,推演浮點神經(jīng)網(wǎng)絡(luò)模型和定點神經(jīng)網(wǎng)絡(luò)模型,計算浮點神經(jīng)網(wǎng)絡(luò)模型和定點神經(jīng)網(wǎng)絡(luò)模型的結(jié)果的余弦相似度作為基準余弦相似度;自檢優(yōu)化單元微調(diào)初始量化參數(shù),生成經(jīng)微調(diào)的定點神經(jīng)網(wǎng)絡(luò)模型,計算浮點神經(jīng)網(wǎng)絡(luò)模型和經(jīng)微調(diào)的定點神經(jīng)網(wǎng)絡(luò)模型的結(jié)果的余弦相似度;判斷經(jīng)微調(diào)的余弦相似度是否大于基準余弦相似度,如果經(jīng)微調(diào)的余弦相似度大于基準余弦相似度,則利用經(jīng)微調(diào)的量化參數(shù)、經(jīng)微調(diào)的定點神經(jīng)網(wǎng)絡(luò)、經(jīng)微調(diào)的余弦相似度更新量化參數(shù)、定點神經(jīng)網(wǎng)絡(luò)和基準余弦相似度。??