一種基于一致性正則訓(xùn)練的場景文本識別系統(tǒng)
基本信息
申請?zhí)?/td> | CN202210061855.X | 申請日 | - |
公開(公告)號 | CN114529904A | 公開(公告)日 | 2022-05-24 |
申請公布號 | CN114529904A | 申請公布日 | 2022-05-24 |
分類號 | G06V30/148(2022.01)I;G06K9/62(2022.01)I;G06V30/19(2022.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 王鵬;鄭財(cái)源 | 申請(專利權(quán))人 | 西北工業(yè)大學(xué)寧波研究院 |
代理機(jī)構(gòu) | 西北工業(yè)大學(xué)專利中心 | 代理人 | - |
地址 | 315048浙江省寧波市高新區(qū)清逸路218弄 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于一致性正則訓(xùn)練的場景文本識別系統(tǒng),屬于場景文本識別領(lǐng)域。整個(gè)系統(tǒng)包括三個(gè)分支,包括監(jiān)督分支、無監(jiān)督分支和域適應(yīng)分支。本發(fā)明使用應(yīng)用一致性正則化方法來訓(xùn)練更魯棒和性能更好的STR模型。具體來說,STR模型接收兩個(gè)未標(biāo)記文本圖像的增強(qiáng)視圖作為輸入,并強(qiáng)制它輸出相同的結(jié)果。通過這種訓(xùn)練方式,模型可以利用大規(guī)模的未標(biāo)簽數(shù)據(jù),學(xué)習(xí)變換不變特征。本發(fā)明在無監(jiān)督分支的一條路徑中添加了一個(gè)投影模塊以防止模型崩潰的解決方案??紤]到訓(xùn)練數(shù)據(jù)和真實(shí)測試數(shù)據(jù)之間的巨大域差距,應(yīng)用域適應(yīng)損失來拉近合成帶標(biāo)簽數(shù)據(jù)與真實(shí)無標(biāo)簽數(shù)據(jù)之間的字符級特征之間的距離。 |
