界面文字識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN202111019211.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113780293A 公開(kāi)(公告)日 2021-12-10
申請(qǐng)公布號(hào) CN113780293A 申請(qǐng)公布日 2021-12-10
分類號(hào) G06K9/34(2006.01)I;G06K9/32(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 王彥瑞 申請(qǐng)(專利權(quán))人 德訊創(chuàng)新(北京)科技有限公司
代理機(jī)構(gòu) 南京利豐知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 陳志軍
地址 100053北京市西城區(qū)宣武門外大街6、8、10、12、16、18號(hào)10號(hào)樓15層1525室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種界面文字識(shí)別方法,涉及文字識(shí)別技術(shù)領(lǐng)域,包括獲取圖像;對(duì)所述圖像進(jìn)行預(yù)處理,得到待識(shí)別圖像;對(duì)所述待識(shí)別圖像進(jìn)行版面分析,根據(jù)屬性將所述待識(shí)別圖像分割為不同部分,并標(biāo)定各部分的屬性;對(duì)標(biāo)定為文字的圖像部分進(jìn)行圖像切分,以切分出獨(dú)立的個(gè)體文字;對(duì)所述個(gè)體文字進(jìn)行特征提取,并將提取到的特征與已有特征庫(kù)內(nèi)中的特征進(jìn)行比對(duì),確定相似度最高的特征所對(duì)應(yīng)的文字,并作為識(shí)別文字。本發(fā)明不僅使文字識(shí)別的準(zhǔn)確度更高,而且可適用于較為復(fù)雜的圖文場(chǎng)景的文字識(shí)別,同時(shí),可根據(jù)版面信息進(jìn)行重構(gòu),便于后續(xù)的處理。