文本行語種識別方法、裝置、電子設(shè)備

基本信息

申請?zhí)?/td> CN202110650294.2 申請日 -
公開(公告)號 CN113468979A 公開(公告)日 2021-10-01
申請公布號 CN113468979A 申請公布日 2021-10-01
分類號 G06K9/00(2006.01)I;G06K9/32(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 黃荔;劉正珍 申請(專利權(quán))人 漢王科技股份有限公司
代理機構(gòu) 北京潤澤恒知識產(chǎn)權(quán)代理有限公司 代理人 莎日娜
地址 100193北京市海淀區(qū)東北旺西路8號5號樓三層
法律狀態(tài) -

摘要

摘要 本申請公開了一種文本行語種識別方法,屬于計算機視覺技術(shù)領(lǐng)域,有助于提升圖像中文本行語種識別的準確度。所述方法包括:通過預(yù)設(shè)深度學(xué)習(xí)網(wǎng)絡(luò)的特征提取模塊,對目標文本圖像進行特征提取和融合處理,得到第一向量表示;通過該網(wǎng)絡(luò)的第一分類模塊對第一向量表示進行二分類映射,確定目標文本圖像的二類別概率預(yù)測圖;基于二類別概率預(yù)測圖,通過該網(wǎng)絡(luò)的注意力模塊對第一向量表示中對應(yīng)前景像素點的向量進行加權(quán)處理,得到第二向量表示;通過該網(wǎng)絡(luò)的第二分類模塊對第二向量表示進行多分類映射,確定多類別概率預(yù)測圖;根據(jù)多類別概率預(yù)測圖,確定目標文本圖像中匹配各預(yù)設(shè)語種的文本行的位置信息,提升了圖像中文本行及語種識別準確度。