一種數(shù)據(jù)處理方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202110463485.8 申請日 -
公開(公告)號 CN112883980B 公開(公告)日 2021-09-21
申請公布號 CN112883980B 申請公布日 2021-09-21
分類號 G06K9/34(2006.01)I;G06K9/46(2006.01)I;G06K9/62(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 姚娟娟;鐘南山;陳君石 申請(專利權(quán))人 明品云(北京)數(shù)據(jù)科技有限公司
代理機(jī)構(gòu) 上海漢之律師事務(wù)所 代理人 馮華
地址 102400北京市房山區(qū)長陽萬興路86號-N3557
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種數(shù)據(jù)處理方法及系統(tǒng),方法包括:獲取原始圖像集;將原始圖像集輸入第一卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,獲取文字識別模型;獲取待識別圖像;將待識別圖像輸入文字識別模型進(jìn)行文字識別,獲取識別結(jié)果;將識別結(jié)果輸入語義標(biāo)簽提取模型進(jìn)行語義標(biāo)簽提取,獲取識別結(jié)果中的文本向量的語義標(biāo)簽;根據(jù)語義標(biāo)簽,對識別結(jié)果進(jìn)行一次更新,進(jìn)而進(jìn)行文字協(xié)同編輯;本發(fā)明中的數(shù)據(jù)處理方法,通過對待識別圖像進(jìn)行文字識別,并將識別結(jié)果輸入語義標(biāo)簽提取模型進(jìn)行語義標(biāo)簽提取,根據(jù)提取出的語義標(biāo)簽,對識別結(jié)果進(jìn)行一次更新,進(jìn)而進(jìn)行多端文字協(xié)同編輯,實(shí)現(xiàn)對圖像中的文本數(shù)據(jù)的快速提取與協(xié)同編輯,文本識別精確度較高。