基于正則匹配的文本識(shí)別方法、文本識(shí)別裝置和電子設(shè)備

基本信息

申請(qǐng)?zhí)?/td> CN202011576184.8 申請(qǐng)日 -
公開(公告)號(hào) CN112580345A 公開(公告)日 2021-03-30
申請(qǐng)公布號(hào) CN112580345A 申請(qǐng)公布日 2021-03-30
分類號(hào) G06F40/284(2020.01)I;G06F40/289(2020.01)I;G06K9/00(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 熊思宇;朱永強(qiáng) 申請(qǐng)(專利權(quán))人 成都網(wǎng)安科技發(fā)展有限公司
代理機(jī)構(gòu) 成都極刻智慧知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 唐維虎
地址 610000四川省成都市高新西區(qū)創(chuàng)業(yè)中心A224
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┑幕谡齽t匹配的文本識(shí)別方法、文本識(shí)別裝置和電子設(shè)備,涉及文本識(shí)別技術(shù)領(lǐng)域。在本申請(qǐng)中,首先,獲取待識(shí)別文本,其中,待識(shí)別文本包括至少一個(gè)基于變長(zhǎng)編碼表示的待識(shí)別字符。其次,在至少一個(gè)待識(shí)別字符中確定一個(gè)目標(biāo)待識(shí)別字符,并將目標(biāo)待識(shí)別字符轉(zhuǎn)換為目標(biāo)進(jìn)制的目標(biāo)數(shù)字。然后,基于確定有限狀態(tài)自動(dòng)機(jī)對(duì)目標(biāo)數(shù)字進(jìn)行匹配處理,其中,確定有限狀態(tài)自動(dòng)機(jī)基于對(duì)目標(biāo)正則表達(dá)式進(jìn)行轉(zhuǎn)換處理得到,且確定有限狀態(tài)自動(dòng)機(jī)中每一條轉(zhuǎn)移邊對(duì)應(yīng)的字符基于目標(biāo)進(jìn)制表示。最后,若目標(biāo)數(shù)字匹配失敗,則停止對(duì)待識(shí)別文本進(jìn)行匹配處理?;谏鲜龇椒ǎ梢愿纳片F(xiàn)有的文本識(shí)別技術(shù)中存在的資源浪費(fèi)的問題。??