一種文本識別模型的構(gòu)建及文本識別方法和裝置

基本信息

申請?zhí)?/td> CN202010966835.8 申請日 -
公開(公告)號 CN112183525A 公開(公告)日 2021-01-05
申請公布號 CN112183525A 申請公布日 2021-01-05
分類號 G06K9/32;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 高遠 申請(專利權)人 中保車服科技服務股份有限公司
代理機構(gòu) 深圳中細軟知識產(chǎn)權代理有限公司 代理人 孫凱樂
地址 518028 廣東省深圳市福田區(qū)華富街道蓮花一村社區(qū)皇崗路5001號深業(yè)上城(南區(qū))T2棟4409
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例公開了一種文本識別模型的構(gòu)建及文本識別方法和裝置,其中該構(gòu)建方法包括:獲取待識別的目標文本行圖像,所述目標文本行圖像上只保留文本數(shù)據(jù);將所述目標文本行圖像對初始神經(jīng)網(wǎng)絡進行訓練,并判斷使用所述目標文本行圖像對所述初始神經(jīng)網(wǎng)絡的訓練是否已經(jīng)達到預定目標;若是,則記錄并保存此時的所述初始神經(jīng)網(wǎng)絡對應的網(wǎng)絡結(jié)構(gòu)與模型參數(shù)數(shù)值,將其作為所述文本識別模型對應的網(wǎng)絡結(jié)構(gòu)與模型參數(shù)數(shù)值。本發(fā)明解決了現(xiàn)有技術的以下問題:傳統(tǒng)文本識別模型只有一個解碼器,由該解碼器來統(tǒng)一識別這兩類以上的文本行時,差別較大的文本行將使得解碼器難以擬合,并且會拋棄有助于解碼器進行解碼的文本行類別信息。