訓(xùn)練數(shù)據(jù)生成方法和裝置、以及模型的訓(xùn)練方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910211469.2 申請(qǐng)日 -
公開(公告)號(hào) CN109978044B 公開(公告)日 2021-03-19
申請(qǐng)公布號(hào) CN109978044B 申請(qǐng)公布日 2021-03-19
分類號(hào) G06K9/62(2006.01)I;G06K9/34(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 戴亦斌;謝春鴻 申請(qǐng)(專利權(quán))人 廣州云測(cè)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京國昊天誠知識(shí)產(chǎn)權(quán)代理有限公司 代理人 劉昕;南霆
地址 510260廣東省廣州市中新廣州知識(shí)城鳳凰三路8號(hào)2號(hào)樓2016房
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種針對(duì)文本識(shí)別模型的訓(xùn)練數(shù)據(jù)生成方法及裝置,以及一種針對(duì)文本識(shí)別模型的訓(xùn)練數(shù)據(jù)生成方法及裝置,在收集訓(xùn)練數(shù)據(jù)時(shí),結(jié)合文本控件對(duì)于文本區(qū)域的全面覆蓋,以及布局識(shí)別對(duì)于圖像元素進(jìn)行無多余范圍的準(zhǔn)確識(shí)別,可以從包含文本的樣本圖像中,較為準(zhǔn)確地裁剪出包含文本的目標(biāo)區(qū)域,以及對(duì)應(yīng)的文本內(nèi)容,通過這種方式可以較為高效、準(zhǔn)確地收集訓(xùn)練數(shù)據(jù)。而在進(jìn)行模型訓(xùn)練時(shí),可以以單行文本作為輔助訓(xùn)練文本,通過將單行文本附著在模擬應(yīng)用場(chǎng)景的背景圖像中,從而裁剪出包含單行文本的輔助訓(xùn)練圖像。據(jù)此,可以將模擬出的輔助訓(xùn)練數(shù)據(jù)和實(shí)際收集到的訓(xùn)練數(shù)據(jù)進(jìn)行結(jié)合,對(duì)文本識(shí)別模型進(jìn)行訓(xùn)練,進(jìn)而提高訓(xùn)練后模型的性能。??