一種將金融文本結(jié)構(gòu)化為表格的深度學(xué)習(xí)模型裝置

基本信息

申請?zhí)?/td> CN202110415793.3 申請日 -
公開(公告)號 CN113326676A 公開(公告)日 2021-08-31
申請公布號 CN113326676A 申請公布日 2021-08-31
分類號 G06F40/157(2020.01)I;G06F40/126(2020.01)I;G06F40/183(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周靖宇;景泳霖;袁陽平;鄒鴻岳 申請(專利權(quán))人 北京快確信息科技有限公司
代理機(jī)構(gòu) 深圳華屹智林知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳裕恒
地址 201700上海市青浦區(qū)浦倉路485號1幢2層
法律狀態(tài) -

摘要

摘要 一種將金融文本結(jié)構(gòu)化為表格的深度學(xué)習(xí)模型裝置,它包含以下步驟技術(shù)方案:步驟一,預(yù)處理,數(shù)據(jù)清洗,文本分詞、形成字符和詞,表格行標(biāo)簽;步驟二,詞向量化;步驟三,字符編碼層;步驟四,字符編碼和詞編碼的連接層;步驟五,列信息的預(yù)測;步驟六,行信息的預(yù)測的前處理;步驟七,行信息的預(yù)測;步驟八,總loss函數(shù)的設(shè)置。通過一個(gè)模型,直接將非結(jié)構(gòu)文本轉(zhuǎn)換為表格數(shù)據(jù),在金融的數(shù)據(jù)領(lǐng)域,達(dá)到了商業(yè)化的標(biāo)準(zhǔn),相比于Pipeline的形式,其提高了3?5個(gè)百分點(diǎn),降低了pipeline的誤差傳遞的問題。