一種維語(yǔ)圖片字符的識(shí)別方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910583713.8 申請(qǐng)日 -
公開(公告)號(hào) CN110287952B 公開(公告)日 2021-07-20
申請(qǐng)公布號(hào) CN110287952B 申請(qǐng)公布日 2021-07-20
分類號(hào) G06K9/20;G06K9/34;G06K9/62 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫萍;高巖;陳宏江;趙全軍;楊浩 申請(qǐng)(專利權(quán))人 中科軟科技股份有限公司
代理機(jī)構(gòu) 北京天盾知識(shí)產(chǎn)權(quán)代理有限公司 代理人 張彩珍
地址 100190 北京市海淀區(qū)中關(guān)村新科祥園甲6號(hào)樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了維語(yǔ)圖片字符的識(shí)別方法,包括:將采集的原始圖片進(jìn)行標(biāo)記,將標(biāo)記后的圖片作為待訓(xùn)練樣本;將待訓(xùn)練樣本輸入到CNN+BiLSTM模型中以提取待訓(xùn)練樣本的特征向量,對(duì)待訓(xùn)練樣本的特征向量進(jìn)行訓(xùn)練,生成維文文本區(qū)域定位網(wǎng)絡(luò)模型;將待訓(xùn)練樣本中包含維語(yǔ)文本區(qū)域的圖片輸入CNN網(wǎng)絡(luò)模型,提取所述維語(yǔ)文本區(qū)域的特征;將維語(yǔ)文本區(qū)域的特征輸入BiLSTM+CTC網(wǎng)絡(luò)模型中,獲得維語(yǔ)字符序列,根據(jù)維語(yǔ)字符序列生成維語(yǔ)字符識(shí)別網(wǎng)絡(luò)模型;利用維文文本區(qū)域定位網(wǎng)絡(luò)模型識(shí)別待檢測(cè)圖片的維語(yǔ)文本區(qū)域;利用維語(yǔ)字符識(shí)別網(wǎng)絡(luò)模型識(shí)別待檢測(cè)圖片的維語(yǔ)文本區(qū)域中的維語(yǔ)字符。本發(fā)明還公開了維語(yǔ)圖片字符的識(shí)別系統(tǒng)。通過本發(fā)明可以準(zhǔn)確的識(shí)別出維語(yǔ)字符。