一種文檔圖像分類方法
基本信息
申請?zhí)?/td> | CN201811526387.9 | 申請日 | - |
公開(公告)號 | CN109344815B | 公開(公告)日 | 2021-08-13 |
申請公布號 | CN109344815B | 申請公布日 | 2021-08-13 |
分類號 | G06K9/00;G06F16/35 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 侯進(jìn);黃賢俊 | 申請(專利權(quán))人 | 北京深智恒際科技有限公司 |
代理機(jī)構(gòu) | 北京匯信合知識產(chǎn)權(quán)代理有限公司 | 代理人 | 孫民興 |
地址 | 100086 北京市海淀區(qū)知春路113號0706-003 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種文檔圖像分類方法,包括:1、基于深度卷積神經(jīng)網(wǎng)絡(luò),對文檔圖像進(jìn)行圖像內(nèi)容特征提?。?、以1為輸入利用目標(biāo)檢測框架對文檔中的各關(guān)鍵信息條目位置進(jìn)行檢測回歸;3、通過2中回歸的各關(guān)鍵信息條目的坐標(biāo)信息,裁剪抽取出各關(guān)鍵信息條目所在位置對應(yīng)的圖像內(nèi)容特征的特征信息集合;4、基于2中檢測的各關(guān)鍵信息條目的相對位置關(guān)系,按照預(yù)設(shè)排序邏輯對3中提取的特征信息集合進(jìn)行順序重組;5、利用可變長輸入的深度循環(huán)網(wǎng)絡(luò)對4中重組后的特征信息集合,進(jìn)行深度融合并最終給出文檔圖像的分類結(jié)果。本發(fā)明利用CNN+RNN的技術(shù)巧妙地組合了圖像文本內(nèi)容特征和圖像中內(nèi)容的布局特征信息;整體精度能達(dá)到98%的準(zhǔn)確率。 |
