一種將金融文本結(jié)構(gòu)化為表格的深度學(xué)習(xí)模型裝置
基本信息
申請?zhí)?/td> | CN202110415793.3 | 申請日 | - |
公開(公告)號 | CN113326676A | 公開(公告)日 | 2021-08-31 |
申請公布號 | CN113326676A | 申請公布日 | 2021-08-31 |
分類號 | G06F40/157(2020.01)I;G06F40/126(2020.01)I;G06F40/183(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 周靖宇;景泳霖;袁陽平;鄒鴻岳 | 申請(專利權(quán))人 | 北京快確信息科技有限公司 |
代理機(jī)構(gòu) | 深圳華屹智林知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 陳裕恒 |
地址 | 201700上海市青浦區(qū)浦倉路485號1幢2層 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種將金融文本結(jié)構(gòu)化為表格的深度學(xué)習(xí)模型裝置,它包含以下步驟技術(shù)方案:步驟一,預(yù)處理,數(shù)據(jù)清洗,文本分詞、形成字符和詞,表格行標(biāo)簽;步驟二,詞向量化;步驟三,字符編碼層;步驟四,字符編碼和詞編碼的連接層;步驟五,列信息的預(yù)測;步驟六,行信息的預(yù)測的前處理;步驟七,行信息的預(yù)測;步驟八,總loss函數(shù)的設(shè)置。通過一個(gè)模型,直接將非結(jié)構(gòu)文本轉(zhuǎn)換為表格數(shù)據(jù),在金融的數(shù)據(jù)領(lǐng)域,達(dá)到了商業(yè)化的標(biāo)準(zhǔn),相比于Pipeline的形式,其提高了3?5個(gè)百分點(diǎn),降低了pipeline的誤差傳遞的問題。 |
