圖像文字檢測(cè)方法、系統(tǒng)及電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202010751818.2 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114067322A 公開(kāi)(公告)日 2022-02-18
申請(qǐng)公布號(hào) CN114067322A 申請(qǐng)公布日 2022-02-18
分類號(hào) G06V30/148(2022.01)I;G06V30/412(2022.01)I;G06V10/40(2022.01)I;G06V10/80(2022.01)I;G06V30/19(2022.01)I;G06V10/774(2022.01)I;G06V10/764(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 譚明強(qiáng);李文華;趙耀;張彬;雷劍;謝新標(biāo);韓增輝 申請(qǐng)(專利權(quán))人 中國(guó)移動(dòng)通信集團(tuán)山東有限公司
代理機(jī)構(gòu) 北京國(guó)昊天誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王思超
地址 550081貴州省貴陽(yáng)市觀山湖區(qū)金誠(chéng)街1號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種圖像文字檢測(cè)方法、系統(tǒng)及電子設(shè)備,該方法包括:利用高分辨率的特征提取網(wǎng)絡(luò),提取待檢測(cè)圖像的圖像特征,所述圖像特征包含多個(gè)圖像點(diǎn);根據(jù)所述圖像點(diǎn)是否屬于同一文本,對(duì)所述待檢測(cè)圖像中的圖像點(diǎn)進(jìn)行分割,得到多個(gè)圖像文本框;提取所述多個(gè)圖像文本框,所述圖像文本框包含的文字即為所述待檢測(cè)圖像的文字。本發(fā)明實(shí)施例采用高分辨率的特征提取網(wǎng)絡(luò),在特征提取過(guò)程中可以始終保持不同分辨率大小特征間的通信,能夠避免在卷積過(guò)程中由于特征縮小導(dǎo)致的信息丟失,通過(guò)圖像點(diǎn)鄰近點(diǎn)之間是否同屬于文字內(nèi),可以實(shí)現(xiàn)快速,有效的對(duì)圖像中復(fù)雜的場(chǎng)景文字進(jìn)行檢測(cè)。