一種基于生成對(duì)抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011293572.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112288032B 公開(kāi)(公告)日 2022-01-14
申請(qǐng)公布號(hào) CN112288032B 申請(qǐng)公布日 2022-01-14
分類(lèi)號(hào) G06K9/62(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 康燕斌;張志齊 申請(qǐng)(專(zhuān)利權(quán))人 上海依圖網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 代理人 朱佳
地址 200051上海市徐匯區(qū)宜州路180號(hào)1幢第1層01、02室
法律狀態(tài) -

摘要

摘要 本公開(kāi)涉及計(jì)算機(jī)技術(shù),特別涉及一種基于生成對(duì)抗網(wǎng)絡(luò)的量化模型訓(xùn)練的方法及裝置。用以降低模型在低比特量化時(shí)的性能損失,該方法為:服務(wù)器采用對(duì)抗方式對(duì)第一分類(lèi)模型、第一分類(lèi)模型量化后的第二分類(lèi)模型,以及第三分類(lèi)模型進(jìn)行訓(xùn)練,將樣本數(shù)據(jù)分別輸入第一分類(lèi)模型和第二分類(lèi)模型,將獲得的第一處理結(jié)果和第二處理結(jié)果,以及樣本數(shù)據(jù),輸入第三分類(lèi)模型,得到第三處理結(jié)果,再通過(guò)對(duì)第三處理結(jié)果與真實(shí)結(jié)果進(jìn)行比對(duì)獲得相應(yīng)的梯度,并采用梯度對(duì)第一分類(lèi)模型,第二分類(lèi)模型以及第三分類(lèi)模型進(jìn)行參數(shù)調(diào)整,最終,輸出訓(xùn)練完畢的第二分類(lèi)模型。這樣,既降低了第一分類(lèi)模型在低比特量化時(shí)的性能損失,也保證了第二分類(lèi)模型的精度不受影響。