一種面向金融場景的端到端自然語言處理訓(xùn)練框架與方法

基本信息

申請?zhí)?/td> CN202111163479.7 申請日 -
公開(公告)號 CN113887230A 公開(公告)日 2022-01-04
申請公布號 CN113887230A 申請公布日 2022-01-04
分類號 G06F40/295(2020.01)I;G06F40/30(2020.01)I;G06F16/35(2019.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06Q40/02(2012.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 付志兵;張夢超;李漁;費(fèi)斌杰 申請(專利權(quán))人 北京熵簡科技有限公司
代理機(jī)構(gòu) 上海劍秋知識產(chǎn)權(quán)代理有限公司 代理人 徐浩俊
地址 100085北京市海淀區(qū)上地三街9號D座3層D408
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種面向金融場景的端到端自然語言處理訓(xùn)練框架與方法,涉及自然語言處理領(lǐng)域,所述訓(xùn)練框架包括:Google原生BERT模塊、FinBERT預(yù)訓(xùn)練模塊、基于類似self?training思想從外部相關(guān)數(shù)據(jù)中挖掘新數(shù)據(jù)模塊、下游任務(wù)語料上進(jìn)行預(yù)訓(xùn)練模塊、用半監(jiān)督學(xué)習(xí)的框架來充分利用無標(biāo)簽語料模塊、知識蒸餾模塊、線上部署模塊。所述訓(xùn)練方法包括以:步驟1、FinBERT預(yù)訓(xùn)練;步驟2、基于類似self?training思想從外部相關(guān)數(shù)據(jù)中挖掘新數(shù)據(jù);步驟3、下游任務(wù)語料上進(jìn)行預(yù)訓(xùn)練,對所述FinBERT進(jìn)行再一次預(yù)訓(xùn)練,得到的模型稱之為TASK FinBERT;步驟4、用半監(jiān)督學(xué)習(xí)的框架來充分利用無標(biāo)簽語料,在TASK FinBERT的基礎(chǔ)上,訓(xùn)練得到的模型稱之為UDA FinBERT;步驟5、蒸餾學(xué)習(xí),將學(xué)習(xí)到的知識和特征蒸餾到輕量級模型上。