訓(xùn)練數(shù)據(jù)生成方法和裝置、以及模型的訓(xùn)練方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201910211469.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN109978044B | 公開(公告)日 | 2021-03-19 |
申請(qǐng)公布號(hào) | CN109978044B | 申請(qǐng)公布日 | 2021-03-19 |
分類號(hào) | G06K9/62(2006.01)I;G06K9/34(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 戴亦斌;謝春鴻 | 申請(qǐng)(專利權(quán))人 | 廣州云測(cè)信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京國昊天誠知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 劉昕;南霆 |
地址 | 510260廣東省廣州市中新廣州知識(shí)城鳳凰三路8號(hào)2號(hào)樓2016房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開一種針對(duì)文本識(shí)別模型的訓(xùn)練數(shù)據(jù)生成方法及裝置,以及一種針對(duì)文本識(shí)別模型的訓(xùn)練數(shù)據(jù)生成方法及裝置,在收集訓(xùn)練數(shù)據(jù)時(shí),結(jié)合文本控件對(duì)于文本區(qū)域的全面覆蓋,以及布局識(shí)別對(duì)于圖像元素進(jìn)行無多余范圍的準(zhǔn)確識(shí)別,可以從包含文本的樣本圖像中,較為準(zhǔn)確地裁剪出包含文本的目標(biāo)區(qū)域,以及對(duì)應(yīng)的文本內(nèi)容,通過這種方式可以較為高效、準(zhǔn)確地收集訓(xùn)練數(shù)據(jù)。而在進(jìn)行模型訓(xùn)練時(shí),可以以單行文本作為輔助訓(xùn)練文本,通過將單行文本附著在模擬應(yīng)用場(chǎng)景的背景圖像中,從而裁剪出包含單行文本的輔助訓(xùn)練圖像。據(jù)此,可以將模擬出的輔助訓(xùn)練數(shù)據(jù)和實(shí)際收集到的訓(xùn)練數(shù)據(jù)進(jìn)行結(jié)合,對(duì)文本識(shí)別模型進(jìn)行訓(xùn)練,進(jìn)而提高訓(xùn)練后模型的性能。?? |
