一種基于深度學(xué)習(xí)對視頻或圖片中數(shù)字的檢測和識別方法

基本信息

申請?zhí)?/td> CN201810303834.8 申請日 -
公開(公告)號 CN108564077A 公開(公告)日 2018-09-21
申請公布號 CN108564077A 申請公布日 2018-09-21
分類號 G06K9/20;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 朱齊丹;呂曉龍;游錦成;吳禹辰 申請(專利權(quán))人 哈爾濱哈船智控科技有限責(zé)任公司
代理機構(gòu) 哈爾濱市陽光惠遠(yuǎn)知識產(chǎn)權(quán)代理有限公司 代理人 哈爾濱哈船智控科技有限責(zé)任公司
地址 150001 黑龍江省哈爾濱市南崗區(qū)南通大街258號哈爾濱船舶電子大世界西區(qū)5層第501-1號
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于深度學(xué)習(xí)對視頻或圖片中數(shù)字的檢測和識別方法,對采集樣本進(jìn)行處理并制作訓(xùn)練數(shù)據(jù),選擇合適的方式對圖片中的數(shù)字進(jìn)行標(biāo)定。模擬可能出現(xiàn)的數(shù)字特征增加訓(xùn)練集,對數(shù)字進(jìn)行各種特征的變換操作,把制作的數(shù)字樣本置入采集的圖片中并進(jìn)行自動標(biāo)記。制作訓(xùn)練數(shù)據(jù)完成后,采用faster?rcnn算法,聯(lián)合訓(xùn)練一個rpn網(wǎng)絡(luò)和識別網(wǎng)絡(luò),再由訓(xùn)練完成后的模型對實時采集的視頻或圖片進(jìn)行識別。本發(fā)明在各種場景、光照等條件下取得豐富的訓(xùn)練樣本,并對圖像中的數(shù)字及數(shù)字的標(biāo)記進(jìn)行合理設(shè)計,又人工設(shè)計了極豐富的不同特征的訓(xùn)練樣本供網(wǎng)絡(luò)進(jìn)行學(xué)習(xí),極大減少了誤識別或不識別的情況,并有很快的檢測速度。