一種針對(duì)具有大字符間距與局部遮擋的場(chǎng)景文本檢測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN202011110021.0 申請(qǐng)日 -
公開(公告)號(hào) CN112215235A 公開(公告)日 2021-01-12
申請(qǐng)公布號(hào) CN112215235A 申請(qǐng)公布日 2021-01-12
分類號(hào) G06K9/34(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 高攀;劉磊;黃軍文;湯紅 申請(qǐng)(專利權(quán))人 深圳華付技術(shù)股份有限公司
代理機(jī)構(gòu) 深圳市中興達(dá)專利代理有限公司 代理人 深圳市華付信息技術(shù)有限公司
地址 518000廣東省深圳市前海深港合作區(qū)前灣一路1號(hào)A棟201室(入駐深圳市前海商務(wù)秘書有限公司)
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于光學(xué)字符識(shí)別技術(shù)領(lǐng)域,尤其涉及一種針對(duì)具有大字符間距與局部遮擋的場(chǎng)景文本檢測(cè)方法,包括以下步驟:S1、通過全卷積神經(jīng)網(wǎng)絡(luò)對(duì)輸入的圖片提取特征,并將不同層次的特征進(jìn)行融合;S2、融合后的特征經(jīng)過文本語義分割網(wǎng)絡(luò)輸出文本分割圖,以及經(jīng)過文本實(shí)例特征嵌入模塊輸出文本實(shí)例嵌入特征圖;S3、將文本分割圖與文本實(shí)例嵌入特征圖通過文本實(shí)例重組算法得到文本檢測(cè)結(jié)果。其中文本實(shí)例嵌入模塊將每個(gè)像素嵌入特征空間,文本區(qū)域中的平均像素特征視為文本區(qū)域的特征,隨后,文本實(shí)例重組算法將具有相似特征的文本候選區(qū)域進(jìn)行重組,由于字符間距大或局部被遮擋而被分割為多個(gè)區(qū)域的文本實(shí)例,能夠重新被檢測(cè)成一個(gè)完整的對(duì)象。??