一種基于深度學(xué)習(xí)模型的紙質(zhì)表格轉(zhuǎn)word文檔的方法
基本信息
申請?zhí)?/td> | CN202110939325.6 | 申請日 | - |
公開(公告)號 | CN113705395A | 公開(公告)日 | 2021-11-26 |
申請公布號 | CN113705395A | 申請公布日 | 2021-11-26 |
分類號 | G06K9/00(2006.01)I;G06F40/174(2020.01)I;G06F40/18(2020.01)I;G06F1/18(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 葉海亮 | 申請(專利權(quán))人 | 南京英諾森軟件科技有限公司 |
代理機(jī)構(gòu) | 南京普睿益思知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 何薇 |
地址 | 210000江蘇省南京市鼓樓區(qū)中央路201號金茂廣場南塔12A03 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于深度學(xué)習(xí)模型的紙質(zhì)表格轉(zhuǎn)word文檔的方法,屬于圖像處理、人工智能技術(shù)領(lǐng)域,本方案根據(jù)表格提取的結(jié)果對表格圖像中的文本信息進(jìn)行提取,并填入word表格相應(yīng)位置,本申請能夠?qū)⒏黝惣堎|(zhì)文檔中的表格以很高的還原度轉(zhuǎn)換為可編輯的word電子文檔,能夠幫助中大型企業(yè)解決紙質(zhì)文件大量堆積、文件檢索耗時(shí)耗力的問題,實(shí)現(xiàn)紙質(zhì)文件的電子化管理,在技術(shù)層面下,相比現(xiàn)有方法,采用了特殊的數(shù)據(jù)增強(qiáng)手段,不但能夠降低人工標(biāo)注成本,在表格線提取方面具有更好的魯棒性和精度,并且能夠?qū)崿F(xiàn)表格線隱藏和表格線為雙線的表格提取。 |
