圖片文字識別模型訓練方法、裝置及文字識別系統(tǒng)

基本信息

申請?zhí)?/td> CN201910437650.5 申請日 -
公開(公告)號 CN110210542B 公開(公告)日 2021-10-08
申請公布號 CN110210542B 申請公布日 2021-10-08
分類號 G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 陳方毅;白明白 申請(專利權(quán))人 廈門美柚股份有限公司
代理機構(gòu) 廣州嘉權(quán)專利商標事務(wù)所有限公司 代理人 景鵬
地址 361000福建省廈門市廈門火炬高新區(qū)軟件園華訊樓A區(qū)1F-D1
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了圖片文字識別模型訓練方法、裝置及文字識別系統(tǒng)。訓練方法包括:S1、獲取原始圖片,從文本庫中隨機選擇詞語以生成測試文字;S2、隨機結(jié)合測試文字和原始圖片以形成測試圖集;S3、訓練CTPN模型以形成文字定位模型,訓練CRNN模型以形成文字識別模型;S4、依次結(jié)合文字定位模型、文字識別模型以形成圖片文字識別模型。本發(fā)明克服了現(xiàn)有文字識別算法針對于特定種類的圖片中的文字識別正確率不高的問題,有效提高了特定種類的圖片中的文字識別的準確率,從而為后續(xù)的違規(guī)文字或圖片的處理提供識別的基礎(chǔ)。