一種基于深度學(xué)習(xí)和圖像處理的表格識別的還原方法

基本信息

申請?zhí)?/td> CN202011414603.8 申請日 -
公開(公告)號 CN112364834A 公開(公告)日 2021-02-12
申請公布號 CN112364834A 申請公布日 2021-02-12
分類號 G06K9/00(2006.01)I;G06K9/32(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王禛賢;吳偉峰 申請(專利權(quán))人 上海疊念信息科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 200333上海市普陀區(qū)綏德路1弄1號102、202室
法律狀態(tài) -

摘要

摘要 本發(fā)明適用于光學(xué)字符識別技術(shù)領(lǐng)域,具體是一種基于深度學(xué)習(xí)和圖像處理的表格識別的還原方法,包括如下步驟:利用顯著目標(biāo)檢測提取圖像中的線段;并由滿足一定長度的線段計算圖像的偏轉(zhuǎn)角度,初步校正表格的傾斜角度;根據(jù)各線條形成的組合區(qū)域提取圖像的最大凸包;以橫向縱向線條交點(diǎn)數(shù)量、凸包面積篩選處理結(jié)果,得到符合條件的表格圖像凸包進(jìn)行透視變換,進(jìn)一步校正表格的傾斜角度以及一定的畸變;對校正后的交點(diǎn)坐標(biāo)按照一定規(guī)則進(jìn)行合并排序,得出單元格坐標(biāo);利用文字檢測算法提取文本框坐標(biāo);將該表格及其單元格內(nèi)文字內(nèi)容按照一定比例還原至word頁面;進(jìn)而提供了一種魯棒性強(qiáng)、形式簡單、實(shí)現(xiàn)方便的解決方法。??