一種基于深度學(xué)習(xí)的復(fù)雜文字識別方法

基本信息

申請?zhí)?/td> CN201510323797.3 申請日 -
公開(公告)號 CN104966097B 公開(公告)日 2019-01-18
申請公布號 CN104966097B 申請公布日 2019-01-18
分類號 G06K9/62;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 劉世林;何宏靖;吳雨濃 申請(專利權(quán))人 中國農(nóng)業(yè)銀行股份有限公司成都蜀都支行
代理機構(gòu) - 代理人 -
地址 610041 四川省成都市高新區(qū)天府大道中段666號希頓國際廣場B座1005
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及圖像識別領(lǐng)域,特別涉及一種基于深度學(xué)習(xí)的復(fù)雜文字識別方法。通過分析文字復(fù)雜性的原因,使用隨機樣本生成器產(chǎn)生的包含待識別圖片噪聲模型和扭曲特征模型的訓(xùn)練樣本來訓(xùn)練深度神經(jīng)網(wǎng)絡(luò);這樣的訓(xùn)練樣本中包含復(fù)雜的噪聲和扭曲變形,可以滿足各種復(fù)雜文字識別的需要;將少量人工標(biāo)注的第一訓(xùn)練樣本集和隨機生成的大量第二訓(xùn)練樣本集混合后輸入所述深度神經(jīng)網(wǎng)絡(luò)中,解決了通過深度神經(jīng)網(wǎng)絡(luò)來識別文字時需要大量人工標(biāo)注訓(xùn)練樣本的問題;并且在保留了待識別圖片的噪聲、扭曲等復(fù)雜性的前提下,使用最先進(jìn)的深度神經(jīng)網(wǎng)絡(luò)進(jìn)行自動化學(xué)習(xí),避免了現(xiàn)有OCR方法中需要去噪而導(dǎo)致的信息丟失的問題,提高了識別的準(zhǔn)確率。