用于檢測(cè)文本的方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202210328626.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN114663456A 公開(kāi)(公告)日 2022-06-24
申請(qǐng)公布號(hào) CN114663456A 申請(qǐng)公布日 2022-06-24
分類(lèi)號(hào) G06T7/13(2017.01)I;G06V10/26(2022.01)I;G06V10/22(2022.01)I;G06V10/80(2022.01)I;G06V10/82(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李琳 申請(qǐng)(專(zhuān)利權(quán))人 北京貝殼時(shí)代網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 北京潤(rùn)平知識(shí)產(chǎn)權(quán)代理有限公司 代理人 -
地址 101520北京市密云區(qū)興盛南路8號(hào)院2號(hào)樓106室-802(商務(wù)區(qū)集中辦公區(qū))
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供一種用于檢測(cè)文本的方法和裝置,屬于計(jì)算機(jī)視覺(jué)領(lǐng)域。該方法包括:將待檢測(cè)文本的圖像輸入到神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)中,以得到所述圖像的多個(gè)像素點(diǎn)中的每一像素點(diǎn)的像素點(diǎn)信息;針對(duì)所述多個(gè)像素點(diǎn)中的任一像素點(diǎn),基于所述上邊概率、所述下邊概率、所述第一中間概率、所述左邊概率、所述右邊概率和所述第二中間概率,確定所述像素點(diǎn)的第一標(biāo)簽和第二標(biāo)簽;根據(jù)所述多個(gè)像素點(diǎn)的所述第一標(biāo)簽和所述第二標(biāo)簽,確定處于同一行文本中的所述上邊界角點(diǎn)和所述下邊界角點(diǎn);以及連接處于同一行文本中的所述上邊界角點(diǎn)和所述下邊界角點(diǎn),以得到一行文本區(qū)域檢測(cè)框。藉此,解決文本區(qū)域邊界有很多不平整的毛刺的問(wèn)題,減輕了耗時(shí)現(xiàn)象。