一種文本識(shí)別方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110463484.3 申請日 -
公開(公告)號(hào) CN112862024B 公開(公告)日 2021-09-21
申請公布號(hào) CN112862024B 申請公布日 2021-09-21
分類號(hào) G06K9/62(2006.01)I;G06F40/30(2020.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姚娟娟;鐘南山 申請(專利權(quán))人 明品云(北京)數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 上海漢之律師事務(wù)所 代理人 馬婷婷
地址 102400北京市房山區(qū)長陽萬興路86號(hào)-N3557
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種文本識(shí)別方法及系統(tǒng),文本識(shí)別方法包括:采集圖像樣本集,圖像樣本集包括:數(shù)據(jù)來源標(biāo)簽;根據(jù)數(shù)據(jù)來源標(biāo)簽,將圖像樣本集輸入文本識(shí)別網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲取文本識(shí)別模型,文本識(shí)別模型包括:手寫字體識(shí)別模型和印刷字體識(shí)別模型;獲取待識(shí)別圖像;將待識(shí)別圖像輸入文本識(shí)別模型進(jìn)行文本識(shí)別,獲取文本識(shí)別結(jié)果;將文本識(shí)別結(jié)果輸入語義標(biāo)簽提取模型進(jìn)行語義標(biāo)簽提取,獲取文本識(shí)別結(jié)果中的文本向量的語義標(biāo)簽;根據(jù)語義標(biāo)簽,對文本識(shí)別結(jié)果進(jìn)行更新,完成文本識(shí)別;本發(fā)明中的方法,通過獲取手寫字體識(shí)別模型和印刷字體識(shí)別模型,能夠?qū)ΥR(shí)別圖像進(jìn)行較準(zhǔn)確地識(shí)別,通過提取語義標(biāo)簽,對文本識(shí)別結(jié)果進(jìn)行更新,提高識(shí)別精確度。