一種基于深度學(xué)習(xí)的復(fù)雜文字識別方法
基本信息
申請?zhí)?/td> | CN201510323797.3 | 申請日 | - |
公開(公告)號 | CN104966097B | 公開(公告)日 | 2019-01-18 |
申請公布號 | CN104966097B | 申請公布日 | 2019-01-18 |
分類號 | G06K9/62;G06N3/08 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉世林;何宏靖;吳雨濃 | 申請(專利權(quán))人 | 中國農(nóng)業(yè)銀行股份有限公司成都蜀都支行 |
代理機構(gòu) | - | 代理人 | - |
地址 | 610041 四川省成都市高新區(qū)天府大道中段666號希頓國際廣場B座1005 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及圖像識別領(lǐng)域,特別涉及一種基于深度學(xué)習(xí)的復(fù)雜文字識別方法。通過分析文字復(fù)雜性的原因,使用隨機樣本生成器產(chǎn)生的包含待識別圖片噪聲模型和扭曲特征模型的訓(xùn)練樣本來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò);這樣的訓(xùn)練樣本中包含復(fù)雜的噪聲和扭曲變形,可以滿足各種復(fù)雜文字識別的需要;將少量人工標(biāo)注的第一訓(xùn)練樣本集和隨機生成的大量第二訓(xùn)練樣本集混合后輸入所述深度神經(jīng)網(wǎng)絡(luò)中,解決了通過深度神經(jīng)網(wǎng)絡(luò)來識別文字時需要大量人工標(biāo)注訓(xùn)練樣本的問題;并且在保留了待識別圖片的噪聲、扭曲等復(fù)雜性的前提下,使用最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行自動化學(xué)習(xí),避免了現(xiàn)有OCR方法中需要去噪而導(dǎo)致的信息丟失的問題,提高了識別的準(zhǔn)確率。 |
