一種基于深度學(xué)習(xí)的自由格式文檔識別方法
基本信息
申請?zhí)?/td> | CN202011168354.9 | 申請日 | - |
公開(公告)號 | CN112348022A | 公開(公告)日 | 2021-02-09 |
申請公布號 | CN112348022A | 申請公布日 | 2021-02-09 |
分類號 | G06K9/34(2006.01)I; | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王文鋒;傅啟予;韓光祖;秦澤文;鄧梁;朱志童 | 申請(專利權(quán))人 | 富邦華一銀行有限公司 |
代理機(jī)構(gòu) | 上海翰信知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 張維東 |
地址 | 200120上海市浦東新區(qū)自由貿(mào)易試驗區(qū)世紀(jì)大道1168號A座101室、18樓、19樓及20樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于深度學(xué)習(xí)的自由格式文檔識別方法,包括以下步驟:定義模板,所述模板中包含多個矩形碎片的坐標(biāo)位置;獲取待識別文檔;OCR引擎全文識別,以判斷待識別文檔所屬模板;調(diào)用模板中所有矩形碎片的坐標(biāo)位置,采用YOLO目標(biāo)檢測模型將模板中所有矩形碎片及其坐標(biāo)位置對應(yīng)在待識別文檔中;根據(jù)矩形碎片及其坐標(biāo)位置切割待識別文檔,形成多個碎片文件;將多個碎片文件存入數(shù)據(jù)庫,并將多個碎片文件傳入消息隊列中;OCR引擎繼續(xù)識別消息隊列中的碎片文件,得到識別結(jié)果;返回碎片文件和識別結(jié)果到數(shù)據(jù)庫;完成識別。本發(fā)明通過兩次采用OCR引擎進(jìn)行識別,提高了識別的準(zhǔn)確率;還通過提前定義模板及矩形碎片等,從而明確被識別內(nèi)容的作用和意義。?? |
