一種文本標注方法
基本信息
申請?zhí)?/td> | CN202110306681.4 | 申請日 | - |
公開(公告)號 | CN113033380A | 公開(公告)日 | 2021-06-25 |
申請公布號 | CN113033380A | 申請公布日 | 2021-06-25 |
分類號 | G06K9/00;G06K9/20;G06F40/143;G06F40/279 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 張書源 | 申請(專利權(quán))人 | 金科覽智科技(北京)有限公司 |
代理機構(gòu) | - | 代理人 | - |
地址 | 100037 北京市西城區(qū)阜成門外大街31號4層409C | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種文本標注方法,包括以下步驟:S1:通過對圖像進行人工標注與OCR系統(tǒng)自動識別分別得到實體文字框以及自動檢測文字框;S2:計算實體文字框與自動檢測文字框的重疊度,根據(jù)重疊度鏈接兩個文字框,得到自動檢測文字框的文字信息;S3:根據(jù)實體文字框從圖像中將實體文字影像切出,得到文字條影像;S4:將得到的文字條影像送入OCR系統(tǒng)進行識別;S5:將步驟S4中識別出來的文本與步驟S2中自動檢測文字框中識別到的文本進行匹配,生成文本標注數(shù)據(jù)。本發(fā)明中的文本標注方法,通過在圖像上標注實體,能夠做到標注和OCR系統(tǒng)解耦,使OCR系統(tǒng)的迭代升級不會對標注結(jié)果造成影響。 |
