NLP模型優(yōu)化方法、裝置以及計(jì)算機(jī)設(shè)備
基本信息
申請(qǐng)?zhí)?/td> | CN202010756900.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111859904A | 公開(公告)日 | 2020-10-30 |
申請(qǐng)公布號(hào) | CN111859904A | 申請(qǐng)公布日 | 2020-10-30 |
分類號(hào) | G06F40/205(2020.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 陳喜旺;章水鑫 | 申請(qǐng)(專利權(quán))人 | 南京三百云信息科技有限公司 |
代理機(jī)構(gòu) | 北京超凡宏宇專利代理事務(wù)所(特殊普通合伙) | 代理人 | 南京三百云信息科技有限公司 |
地址 | 210000江蘇省南京市鼓樓區(qū)古平崗4號(hào)C座6層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)?zhí)峁┝艘环NNLP模型優(yōu)化方法、裝置以及計(jì)算機(jī)設(shè)備,涉及神經(jīng)網(wǎng)絡(luò)模型技術(shù)領(lǐng)域,緩解了目前的NLP模型的預(yù)測(cè)速度較慢的技術(shù)問題。該方法包括:獲取待優(yōu)化NLP模型;通過對(duì)所述待優(yōu)化NLP模型進(jìn)行剪枝處理,建立所述待優(yōu)化NLP模型的稀疏化模型;對(duì)所述稀疏化模型進(jìn)行量化處理,得到所述稀疏化模型的壓縮后模型;對(duì)所述壓縮后模型的部分代碼轉(zhuǎn)換為預(yù)設(shè)語言代碼,并基于代碼轉(zhuǎn)換后的模型進(jìn)行編譯,得到編譯后模型;所述預(yù)設(shè)語言代碼的運(yùn)行速度大于所述部分代碼的運(yùn)行速度;通過異步處理方式對(duì)所述編譯后模型部署FastAPI,得到優(yōu)化后的NLP模型。?? |
