用于OCR識別的數據增廣方法、裝置、設備及存儲介質

基本信息

申請?zhí)?/td> CN202110991555.7 申請日 -
公開(公告)號 CN113435426A 公開(公告)日 2021-09-24
申請公布號 CN113435426A 申請公布日 2021-09-24
分類號 G06K9/00(2006.01)I;G06K9/62(2006.01)I;G06F40/216(2020.01)I;G06F40/242(2020.01)I 分類 計算;推算;計數;
發(fā)明人 不公告發(fā)明人 申請(專利權)人 珠海億智電子科技有限公司
代理機構 深圳青年人專利商標代理有限公司 代理人 吳桂華
地址 519000廣東省珠海市高新區(qū)唐家灣鎮(zhèn)港樂路8號大洲科技園B區(qū)廠房803室
法律狀態(tài) -

摘要

摘要 本發(fā)明適用于字符識別技術領域,提供了一種用于OCR識別的數據增廣方法、裝置、設備及存儲介質,該方法包括:通過建立識別字典,基于識別字典和已獲取的開源數據集建立第一詞頻字典,基于第一詞頻字典建立合成數據集文本文檔,基于已建立的數據集屬性、OCR識別的應用場景以及合成數據集文本文檔對當前數據集進行數據增廣,得到增廣后的基礎數據集,從而在降低OCR深度算法中獲取訓練樣本的成本的同時,提高了數據增廣的針對性。