文本識別模型的訓(xùn)練方法、文本識別方法、電子設(shè)備、存儲介質(zhì)

基本信息

申請?zhí)?/td> CN202111521025.2 申請日 -
公開(公告)號 CN114187594A 公開(公告)日 2022-03-15
申請公布號 CN114187594A 申請公布日 2022-03-15
分類號 G06V30/148(2022.01)I;G06V30/40(2022.01)I;G06K9/62(2022.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I;G06V10/82(2022.01)I;G06V30/19(2022.01)I 分類 計算;推算;計數(shù);
發(fā)明人 萬鳴;王占一;李寧 申請(專利權(quán))人 奇安信科技集團(tuán)股份有限公司
代理機(jī)構(gòu) 成都維飛知識產(chǎn)權(quán)代理有限公司 代理人 張巧燕
地址 100032北京市西城區(qū)新街口外大街28號102號樓3層332號
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N文本識別模型的訓(xùn)練方法、文本識別方法、電子設(shè)備、計算機(jī)可讀存儲介質(zhì),方法包括:獲取目標(biāo)文字的多條語料數(shù)據(jù);多條語料數(shù)據(jù)包括RTL文字對應(yīng)的第一語料數(shù)據(jù)和LTR文字對應(yīng)的第二語料數(shù)據(jù);根據(jù)多種組合方式,對第一語料數(shù)據(jù)和所述第二語料數(shù)據(jù)進(jìn)行組合,獲得與每一組合方式對應(yīng)的組合語料數(shù)據(jù);生成與每一組合語料數(shù)據(jù)對應(yīng)的樣本圖片和標(biāo)簽,并基于樣本圖片和標(biāo)簽構(gòu)建樣本數(shù)據(jù);根據(jù)樣本數(shù)據(jù)對深度學(xué)習(xí)模型進(jìn)行訓(xùn)練,得到文本識別模型。本申請方案,通過生成復(fù)雜的雙向文本的樣本數(shù)據(jù),可以訓(xùn)練出對雙向文本準(zhǔn)確識別的文本識別模型。