一種OCR快速識(shí)別方法、裝置、設(shè)備和介質(zhì)

基本信息

申請?zhí)?/td> CN202110209228.1 申請日 -
公開(公告)號(hào) CN112990278A 公開(公告)日 2021-06-18
申請公布號(hào) CN112990278A 申請公布日 2021-06-18
分類號(hào) G06K9/62;G06N3/04 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 黃家昌;管發(fā)乾;楊輝;邱道椿 申請(專利權(quán))人 福建億能達(dá)信息技術(shù)股份有限公司
代理機(jī)構(gòu) 福州市鼓樓區(qū)京華專利事務(wù)所(普通合伙) 代理人 林燕
地址 350000 福建省福州市鼓樓區(qū)軟件大道89號(hào)福州軟件園A區(qū)28號(hào)樓二層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種OCR快速識(shí)別方法、裝置、設(shè)備和介質(zhì),方法包括:S1、對(duì)輸入的圖像進(jìn)行預(yù)處理;S2、提取預(yù)處理后圖像的空間潛層信息和時(shí)序潛層信息;所述空間潛層信息由空間模型通過卷積、池化、激活函數(shù)提取而得,空間模型的增加通道卷積層采用1×1卷積核來增加中間向量的通道數(shù);所述時(shí)序潛層信息通過時(shí)序模型的多層雙向SRN層提取而得,雙向SRN層對(duì)大部分運(yùn)算進(jìn)行并行處理;S3、根據(jù)所述空間潛層信息和所述時(shí)序潛層信息,由嵌入層通過CTC進(jìn)行多字符的分類,從而識(shí)別出圖像上的所有字符。本發(fā)明空間模型采用1*1的卷積核來增加中間向量通道,進(jìn)而降低計(jì)算量,同時(shí)將時(shí)序模型改為SRN來提取數(shù)據(jù)的時(shí)序信息,大大提高了模型的處理和識(shí)別速度,從而能實(shí)現(xiàn)實(shí)時(shí)識(shí)別。