一種基于深度學(xué)習(xí)的自由格式文檔識別方法

基本信息

申請?zhí)?/td> CN202011168354.9 申請日 -
公開(公告)號 CN112348022A 公開(公告)日 2021-02-09
申請公布號 CN112348022A 申請公布日 2021-02-09
分類號 G06K9/34(2006.01)I; 分類 計算;推算;計數(shù);
發(fā)明人 王文鋒;傅啟予;韓光祖;秦澤文;鄧梁;朱志童 申請(專利權(quán))人 富邦華一銀行有限公司
代理機(jī)構(gòu) 上海翰信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 張維東
地址 200120上海市浦東新區(qū)自由貿(mào)易試驗區(qū)世紀(jì)大道1168號A座101室、18樓、19樓及20樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于深度學(xué)習(xí)的自由格式文檔識別方法,包括以下步驟:定義模板,所述模板中包含多個矩形碎片的坐標(biāo)位置;獲取待識別文檔;OCR引擎全文識別,以判斷待識別文檔所屬模板;調(diào)用模板中所有矩形碎片的坐標(biāo)位置,采用YOLO目標(biāo)檢測模型將模板中所有矩形碎片及其坐標(biāo)位置對應(yīng)在待識別文檔中;根據(jù)矩形碎片及其坐標(biāo)位置切割待識別文檔,形成多個碎片文件;將多個碎片文件存入數(shù)據(jù)庫,并將多個碎片文件傳入消息隊列中;OCR引擎繼續(xù)識別消息隊列中的碎片文件,得到識別結(jié)果;返回碎片文件和識別結(jié)果到數(shù)據(jù)庫;完成識別。本發(fā)明通過兩次采用OCR引擎進(jìn)行識別,提高了識別的準(zhǔn)確率;還通過提前定義模板及矩形碎片等,從而明確被識別內(nèi)容的作用和意義。??