文本行語種識別方法、裝置、電子設(shè)備
基本信息
申請?zhí)?/td> | CN202110650294.2 | 申請日 | - |
公開(公告)號 | CN113468979A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113468979A | 申請公布日 | 2021-10-01 |
分類號 | G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 黃荔;劉正珍 | 申請(專利權(quán))人 | 漢王科技股份有限公司 |
代理機構(gòu) | 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 | 代理人 | 莎日娜 |
地址 | 100193北京市海淀區(qū)東北旺西路8號5號樓三層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種文本行語種識別方法,屬于計算機視覺技術(shù)領(lǐng)域,有助于提升圖像中文本行語種識別的準確度。所述方法包括:通過預(yù)設(shè)深度學(xué)習(xí)網(wǎng)絡(luò)的特征提取模塊,對目標文本圖像進行特征提取和融合處理,得到第一向量表示;通過該網(wǎng)絡(luò)的第一分類模塊對第一向量表示進行二分類映射,確定目標文本圖像的二類別概率預(yù)測圖;基于二類別概率預(yù)測圖,通過該網(wǎng)絡(luò)的注意力模塊對第一向量表示中對應(yīng)前景像素點的向量進行加權(quán)處理,得到第二向量表示;通過該網(wǎng)絡(luò)的第二分類模塊對第二向量表示進行多分類映射,確定多類別概率預(yù)測圖;根據(jù)多類別概率預(yù)測圖,確定目標文本圖像中匹配各預(yù)設(shè)語種的文本行的位置信息,提升了圖像中文本行及語種識別準確度。 |
