OCR識別模型訓(xùn)練方法、裝置以及計算機可讀存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110485412.9 | 申請日 | - |
公開(公告)號 | CN113159212A | 公開(公告)日 | 2021-07-23 |
申請公布號 | CN113159212A | 申請公布日 | 2021-07-23 |
分類號 | G06K9/62(2006.01)I;G06K9/20(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 鄒錦富;楊皓 | 申請(專利權(quán))人 | 上海云從企業(yè)發(fā)展有限公司 |
代理機構(gòu) | 北京瀚仁知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 屠曉旭;宋寶庫 |
地址 | 201203上海市浦東新區(qū)中國(上海)自由貿(mào)易試驗區(qū)祖沖之路1077號2幢1135-A室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及機器學(xué)習(xí)技術(shù)領(lǐng)域,具體提供了一種OCR識別模型訓(xùn)練方法、裝置及計算機可讀存儲介質(zhì),旨在解決如何便捷且高效地進行圖像樣本標(biāo)簽標(biāo)注,以快速完成OCR識別模型的模型訓(xùn)練的技術(shù)問題。為此目的,本發(fā)明實施例的OCR識別模型訓(xùn)練方法包括:獲取有標(biāo)簽數(shù)據(jù)的第一類圖像樣本;采用第一類圖像樣本訓(xùn)練預(yù)設(shè)的OCR識別模型,獲取初始OCR識別模型;利用初始OCR識別模型識別無標(biāo)簽數(shù)據(jù)的第二類圖像樣本中的業(yè)務(wù)數(shù)據(jù);根據(jù)識別結(jié)果生成標(biāo)簽數(shù)據(jù),對第二類圖像樣本進行標(biāo)簽標(biāo)注;采用第一類圖像樣本和標(biāo)注后的第二類圖像樣本訓(xùn)練初始OCR識別模型,獲取最終OCR識別模型?;谏鲜鰧嵤┓绞剑筄CR識別模型能夠快速地完成模型訓(xùn)練,提升圖像樣本的標(biāo)注準(zhǔn)確度。 |
