一種多規(guī)格文本協(xié)同定位和提取方法

基本信息

申請?zhí)?/td> CN201711360636.7 申請日 -
公開(公告)號 CN108875721A 公開(公告)日 2018-11-23
申請公布號 CN108875721A 申請公布日 2018-11-23
分類號 G06K9/20;G06K9/00 分類 計算;推算;計數(shù);
發(fā)明人 嚴(yán)京旗;張成棟;李進(jìn)文;羅寶娟 申請(專利權(quán))人 南通艾思達(dá)智能科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 226299 江蘇省南通市開發(fā)區(qū)海德路2號1幢110490室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種多規(guī)格文本協(xié)同定位和提取方法,包括如下步驟:步驟110獲取文本圖像數(shù)據(jù);步驟120、圖像歸一化操作;步驟130、分離圖像背景信息和需要采集的前景信息;步驟140、全局協(xié)同搜索,提取出預(yù)設(shè)格式的各個文本塊區(qū)域;步驟150、局部優(yōu)化搜索,在小范圍內(nèi)逐個優(yōu)化各個文本區(qū)域的位置;步驟160輸出各個文本塊定位結(jié)果,提供給后續(xù)單字切分和識別模塊。本發(fā)明利用圖像處理、目標(biāo)檢測、協(xié)同搜索、局部優(yōu)化等技術(shù),滿足格式化數(shù)據(jù)采集的要求,克服某些文本塊退化后的漏檢和錯檢問題并最大程度避免不必要的文本和噪聲信息的干擾,提高格式化文本信息采集的準(zhǔn)度和精度。