一種文本版面分析方法、裝置、設備和介質(zhì)

基本信息

申請?zhí)?/td> CN202010635621.2 申請日 -
公開(公告)號 CN111914654A 公開(公告)日 2020-11-10
申請公布號 CN111914654A 申請公布日 2020-11-10
分類號 G06K9/00(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王波;張百靈;周炬;朱華柏 申請(專利權)人 蘇州開心盒子軟件有限公司
代理機構(gòu) 北京品源專利代理有限公司 代理人 蘇州開心盒子軟件有限公司
地址 215123江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號創(chuàng)意產(chǎn)業(yè)園6-604單元
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例公開了一種文本版面分析方法、裝置、介質(zhì)及電子設備,其中,該方法包括:獲取待分析的文本圖像,對所述文本圖像進行預處理;將所述文本圖像輸入語義分割算法模型進行版面分析,以確定所述文本圖像中的版面元素;其中,所述語義分割算法模型包含編碼階段和解碼階段;所述編碼階段,用于將殘差網(wǎng)絡模型中不同階段的高語義特征與高分辨率網(wǎng)絡分支中的高分辨率語義特征以元素相加的方式進行特征融合;所述解碼器階段,用于將所述編碼階段最后一個階段提取的高語義特征上采樣后與所述編碼階段最后一個特征融合單元輸出的高分辨率語義特征以拼接的方式進行特征融合,以確定所述文本圖像中的版面元素。本發(fā)明實施例提高了版面分析的識別效果。??