決策樹(shù)模型訓(xùn)練方法、確定OCR結(jié)果中數(shù)據(jù)屬性方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201710305571.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107273883B 公開(kāi)(公告)日 2020-04-21
申請(qǐng)公布號(hào) CN107273883B 申請(qǐng)公布日 2020-04-21
分類(lèi)號(hào) G06K9/20;G06K9/62 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 周列淳;岳智磊;劉泓;江巖 申請(qǐng)(專(zhuān)利權(quán))人 天方創(chuàng)新(北京)信息技術(shù)有限公司
代理機(jī)構(gòu) 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 天方創(chuàng)新(北京)信息技術(shù)有限公司
地址 100081 北京市海淀區(qū)大柳樹(shù)富海中心2號(hào)樓11層1104
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)了一種決策樹(shù)模型訓(xùn)練方法、確定OCR結(jié)果中數(shù)據(jù)屬性方法及裝置,其中決策樹(shù)模型訓(xùn)練方法包括:獲取樣本醫(yī)學(xué)資料圖片,并對(duì)樣本醫(yī)學(xué)資料圖片進(jìn)行OCR識(shí)別以生成第一OCR識(shí)別結(jié)果,第一OCR識(shí)別結(jié)果為二維字符串?dāng)?shù)組,二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù);提取第一OCR識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)的第一特征信息;獲取與第一OCR識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注數(shù)據(jù),第一標(biāo)注數(shù)據(jù)用于指示各個(gè)數(shù)據(jù)所屬的屬性;根據(jù)第一特征信息和第一標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練以生成用于確定OCR識(shí)別結(jié)果中數(shù)據(jù)屬性的決策樹(shù)模型。該方法實(shí)現(xiàn)了對(duì)識(shí)別結(jié)果中數(shù)據(jù)屬性的自動(dòng)標(biāo)注的目的,有效降低了待識(shí)別圖片識(shí)別過(guò)程中的消費(fèi)成本,提高了識(shí)別效率。