基于正則匹配的文本識別方法、文本識別裝置和電子設(shè)備

基本信息

申請?zhí)?/td> CN202011576184.8 申請日 -
公開(公告)號 CN112580345A 公開(公告)日 2021-03-30
申請公布號 CN112580345A 申請公布日 2021-03-30
分類號 G06F40/284(2020.01)I;G06F40/289(2020.01)I;G06K9/00(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 熊思宇;朱永強(qiáng) 申請(專利權(quán))人 成都網(wǎng)安科技發(fā)展有限公司
代理機(jī)構(gòu) 成都極刻智慧知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 唐維虎
地址 610000四川省成都市高新西區(qū)創(chuàng)業(yè)中心A224
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┑幕谡齽t匹配的文本識別方法、文本識別裝置和電子設(shè)備,涉及文本識別技術(shù)領(lǐng)域。在本申請中,首先,獲取待識別文本,其中,待識別文本包括至少一個基于變長編碼表示的待識別字符。其次,在至少一個待識別字符中確定一個目標(biāo)待識別字符,并將目標(biāo)待識別字符轉(zhuǎn)換為目標(biāo)進(jìn)制的目標(biāo)數(shù)字。然后,基于確定有限狀態(tài)自動機(jī)對目標(biāo)數(shù)字進(jìn)行匹配處理,其中,確定有限狀態(tài)自動機(jī)基于對目標(biāo)正則表達(dá)式進(jìn)行轉(zhuǎn)換處理得到,且確定有限狀態(tài)自動機(jī)中每一條轉(zhuǎn)移邊對應(yīng)的字符基于目標(biāo)進(jìn)制表示。最后,若目標(biāo)數(shù)字匹配失敗,則停止對待識別文本進(jìn)行匹配處理?;谏鲜龇椒ǎ梢愿纳片F(xiàn)有的文本識別技術(shù)中存在的資源浪費(fèi)的問題。??