文本識別模型的訓(xùn)練方法、文本識別方法、電子設(shè)備、存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202111521025.2 | 申請日 | - |
公開(公告)號 | CN114187594A | 公開(公告)日 | 2022-03-15 |
申請公布號 | CN114187594A | 申請公布日 | 2022-03-15 |
分類號 | G06V30/148(2022.01)I;G06V30/40(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 萬鳴;王占一;李寧 | 申請(專利權(quán))人 | 奇安信科技集團(tuán)股份有限公司 |
代理機(jī)構(gòu) | 成都維飛知識產(chǎn)權(quán)代理有限公司 | 代理人 | 張巧燕 |
地址 | 100032北京市西城區(qū)新街口外大街28號102號樓3層332號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請?zhí)峁┮环N文本識別模型的訓(xùn)練方法、文本識別方法、電子設(shè)備、計算機(jī)可讀存儲介質(zhì),方法包括:獲取目標(biāo)文字的多條語料數(shù)據(jù);多條語料數(shù)據(jù)包括RTL文字對應(yīng)的第一語料數(shù)據(jù)和LTR文字對應(yīng)的第二語料數(shù)據(jù);根據(jù)多種組合方式,對第一語料數(shù)據(jù)和所述第二語料數(shù)據(jù)進(jìn)行組合,獲得與每一組合方式對應(yīng)的組合語料數(shù)據(jù);生成與每一組合語料數(shù)據(jù)對應(yīng)的樣本圖片和標(biāo)簽,并基于樣本圖片和標(biāo)簽構(gòu)建樣本數(shù)據(jù);根據(jù)樣本數(shù)據(jù)對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到文本識別模型。本申請方案,通過生成復(fù)雜的雙向文本的樣本數(shù)據(jù),可以訓(xùn)練出對雙向文本準(zhǔn)確識別的文本識別模型。 |
