圖片文字識(shí)別模型訓(xùn)練方法、裝置及文字識(shí)別系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910437650.5 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110210542B 公開(kāi)(公告)日 2021-10-08
申請(qǐng)公布號(hào) CN110210542B 申請(qǐng)公布日 2021-10-08
分類號(hào) G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 陳方毅;白明白 申請(qǐng)(專利權(quán))人 廈門(mén)美柚股份有限公司
代理機(jī)構(gòu) 廣州嘉權(quán)專利商標(biāo)事務(wù)所有限公司 代理人 景鵬
地址 361000福建省廈門(mén)市廈門(mén)火炬高新區(qū)軟件園華訊樓A區(qū)1F-D1
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了圖片文字識(shí)別模型訓(xùn)練方法、裝置及文字識(shí)別系統(tǒng)。訓(xùn)練方法包括:S1、獲取原始圖片,從文本庫(kù)中隨機(jī)選擇詞語(yǔ)以生成測(cè)試文字;S2、隨機(jī)結(jié)合測(cè)試文字和原始圖片以形成測(cè)試圖集;S3、訓(xùn)練CTPN模型以形成文字定位模型,訓(xùn)練CRNN模型以形成文字識(shí)別模型;S4、依次結(jié)合文字定位模型、文字識(shí)別模型以形成圖片文字識(shí)別模型。本發(fā)明克服了現(xiàn)有文字識(shí)別算法針對(duì)于特定種類的圖片中的文字識(shí)別正確率不高的問(wèn)題,有效提高了特定種類的圖片中的文字識(shí)別的準(zhǔn)確率,從而為后續(xù)的違規(guī)文字或圖片的處理提供識(shí)別的基礎(chǔ)。