一種文檔圖像分類方法

基本信息

申請?zhí)?/td> CN201811526387.9 申請日 -
公開(公告)號 CN109344815B 公開(公告)日 2021-08-13
申請公布號 CN109344815B 申請公布日 2021-08-13
分類號 G06K9/00;G06F16/35 分類 計算;推算;計數(shù);
發(fā)明人 侯進(jìn);黃賢俊 申請(專利權(quán))人 北京深智恒際科技有限公司
代理機(jī)構(gòu) 北京匯信合知識產(chǎn)權(quán)代理有限公司 代理人 孫民興
地址 100086 北京市海淀區(qū)知春路113號0706-003
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種文檔圖像分類方法,包括:1、基于深度卷積神經(jīng)網(wǎng)絡(luò),對文檔圖像進(jìn)行圖像內(nèi)容特征提?。?、以1為輸入利用目標(biāo)檢測框架對文檔中的各關(guān)鍵信息條目位置進(jìn)行檢測回歸;3、通過2中回歸的各關(guān)鍵信息條目的坐標(biāo)信息,裁剪抽取出各關(guān)鍵信息條目所在位置對應(yīng)的圖像內(nèi)容特征的特征信息集合;4、基于2中檢測的各關(guān)鍵信息條目的相對位置關(guān)系,按照預(yù)設(shè)排序邏輯對3中提取的特征信息集合進(jìn)行順序重組;5、利用可變長輸入的深度循環(huán)網(wǎng)絡(luò)對4中重組后的特征信息集合,進(jìn)行深度融合并最終給出文檔圖像的分類結(jié)果。本發(fā)明利用CNN+RNN的技術(shù)巧妙地組合了圖像文本內(nèi)容特征和圖像中內(nèi)容的布局特征信息;整體精度能達(dá)到98%的準(zhǔn)確率。