一種基于深度學(xué)習(xí)模型的紙質(zhì)表格轉(zhuǎn)word文檔的方法

基本信息

申請?zhí)?/td> CN202110939325.6 申請日 -
公開(公告)號 CN113705395A 公開(公告)日 2021-11-26
申請公布號 CN113705395A 申請公布日 2021-11-26
分類號 G06K9/00(2006.01)I;G06F40/174(2020.01)I;G06F40/18(2020.01)I;G06F1/18(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 葉海亮 申請(專利權(quán))人 南京英諾森軟件科技有限公司
代理機(jī)構(gòu) 南京普睿益思知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 何薇
地址 210000江蘇省南京市鼓樓區(qū)中央路201號金茂廣場南塔12A03
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于深度學(xué)習(xí)模型的紙質(zhì)表格轉(zhuǎn)word文檔的方法,屬于圖像處理、人工智能技術(shù)領(lǐng)域,本方案根據(jù)表格提取的結(jié)果對表格圖像中的文本信息進(jìn)行提取,并填入word表格相應(yīng)位置,本申請能夠?qū)⒏黝惣堎|(zhì)文檔中的表格以很高的還原度轉(zhuǎn)換為可編輯的word電子文檔,能夠幫助中大型企業(yè)解決紙質(zhì)文件大量堆積、文件檢索耗時(shí)耗力的問題,實(shí)現(xiàn)紙質(zhì)文件的電子化管理,在技術(shù)層面下,相比現(xiàn)有方法,采用了特殊的數(shù)據(jù)增強(qiáng)手段,不但能夠降低人工標(biāo)注成本,在表格線提取方面具有更好的魯棒性和精度,并且能夠?qū)崿F(xiàn)表格線隱藏和表格線為雙線的表格提取。