一種文檔版面分析方法

基本信息

申請(qǐng)?zhí)?/td> CN202010637093.4 申請(qǐng)日 -
公開(公告)號(hào) CN111881768A 公開(公告)日 2020-11-03
申請(qǐng)公布號(hào) CN111881768A 申請(qǐng)公布日 2020-11-03
分類號(hào) G06K9/00(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王波;張百靈;周炬;朱華柏 申請(qǐng)(專利權(quán))人 蘇州開心盒子軟件有限公司
代理機(jī)構(gòu) 北京尚倫律師事務(wù)所 代理人 蘇州開心盒子軟件有限公司
地址 215123江蘇省蘇州市蘇州工業(yè)園區(qū)星湖街328號(hào)創(chuàng)意產(chǎn)業(yè)園6-604
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文檔版面分析方法,該方法包括將輸入的版面圖像縮放成3種尺度的圖像;將各個(gè)尺度的圖像進(jìn)行特征的提取和融合;將融合后的圖像特征送入分割網(wǎng)絡(luò)主干進(jìn)行語(yǔ)義信息特征的提??;將具有高語(yǔ)義信息的高層低分辨率特征進(jìn)行上采樣,再與具有豐富空間細(xì)節(jié)信息的低層高分辨率特征進(jìn)行融合;根據(jù)不同版面元素的屬性,設(shè)置相應(yīng)的分割網(wǎng)絡(luò)分支進(jìn)行分割識(shí)別,同時(shí),將輸出的特征圖像恢復(fù)到預(yù)先指定的分辨率,完成文檔版面分析。采用了本發(fā)明的技術(shù)方案,能夠融合多尺度輸入圖像,增加分割網(wǎng)絡(luò)對(duì)不同尺度輸入圖像的適應(yīng)能力,降低輸入圖像縮放操作對(duì)模型的影響,針對(duì)版面元素不同屬性增加不同分割網(wǎng)絡(luò)分支,降低不同版面元素的相互影響。??