決策樹(shù)模型訓(xùn)練方法、確定OCR結(jié)果中數(shù)據(jù)屬性方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201710305571.X | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107273883B | 公開(kāi)(公告)日 | 2020-04-21 |
申請(qǐng)公布號(hào) | CN107273883B | 申請(qǐng)公布日 | 2020-04-21 |
分類(lèi)號(hào) | G06K9/20;G06K9/62 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 周列淳;岳智磊;劉泓;江巖 | 申請(qǐng)(專(zhuān)利權(quán))人 | 天方創(chuàng)新(北京)信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 天方創(chuàng)新(北京)信息技術(shù)有限公司 |
地址 | 100081 北京市海淀區(qū)大柳樹(shù)富海中心2號(hào)樓11層1104 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種決策樹(shù)模型訓(xùn)練方法、確定OCR結(jié)果中數(shù)據(jù)屬性方法及裝置,其中決策樹(shù)模型訓(xùn)練方法包括:獲取樣本醫(yī)學(xué)資料圖片,并對(duì)樣本醫(yī)學(xué)資料圖片進(jìn)行OCR識(shí)別以生成第一OCR識(shí)別結(jié)果,第一OCR識(shí)別結(jié)果為二維字符串?dāng)?shù)組,二維字符串?dāng)?shù)組中的每列數(shù)據(jù)用于指示屬于同一個(gè)屬性列的數(shù)據(jù);提取第一OCR識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)的第一特征信息;獲取與第一OCR識(shí)別結(jié)果中的各個(gè)數(shù)據(jù)對(duì)應(yīng)的第一標(biāo)注數(shù)據(jù),第一標(biāo)注數(shù)據(jù)用于指示各個(gè)數(shù)據(jù)所屬的屬性;根據(jù)第一特征信息和第一標(biāo)注數(shù)據(jù)進(jìn)行訓(xùn)練以生成用于確定OCR識(shí)別結(jié)果中數(shù)據(jù)屬性的決策樹(shù)模型。該方法實(shí)現(xiàn)了對(duì)識(shí)別結(jié)果中數(shù)據(jù)屬性的自動(dòng)標(biāo)注的目的,有效降低了待識(shí)別圖片識(shí)別過(guò)程中的消費(fèi)成本,提高了識(shí)別效率。 |
