一種醫(yī)療單證結(jié)構(gòu)化知識(shí)提取的文本檢測(cè)與識(shí)別方法

基本信息

申請(qǐng)?zhí)?/td> CN202010512139.X 申請(qǐng)日 -
公開(公告)號(hào) CN111652162A 公開(公告)日 2020-09-11
申請(qǐng)公布號(hào) CN111652162A 申請(qǐng)公布日 2020-09-11
分類號(hào) G06K9/00(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 向飛;王一哲;羅璟詣;向宇;王剛;唐書毅;黃馳;曾歡 申請(qǐng)(專利權(quán))人 成都知識(shí)視覺科技有限公司
代理機(jī)構(gòu) 成都聚蓉眾享知識(shí)產(chǎn)權(quán)代理有限公司 代理人 成都知識(shí)視覺科技有限公司
地址 610000四川省成都市金牛高新技術(shù)產(chǎn)業(yè)園區(qū)金科東路50號(hào)4號(hào)樓201號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種醫(yī)療單證結(jié)構(gòu)化知識(shí)提取的文本檢測(cè)與識(shí)別方法,屬于醫(yī)療單證信息提取技術(shù)領(lǐng)域,目的在于解決現(xiàn)有醫(yī)療單證信息處理效率低、智能化程度低的問題。其包括以下步驟:(1)圖像識(shí)別:對(duì)醫(yī)療單證圖像進(jìn)行OCR識(shí)別;(2)模板匹配:將識(shí)別的圖像匹配對(duì)應(yīng)模板;(3)文本檢測(cè):通過文本檢測(cè)獲取文本在圖中的位置信息;(4)錯(cuò)位調(diào)整:利用文本間的空間和語義關(guān)系,將錯(cuò)位文字調(diào)整正確;(5)文本識(shí)別:通過OCR識(shí)別文本,轉(zhuǎn)換成文本數(shù)據(jù);(6)結(jié)果校驗(yàn):基于規(guī)則引擎、垂直領(lǐng)域知識(shí)圖譜、值域統(tǒng)計(jì)對(duì)識(shí)別結(jié)果進(jìn)行校驗(yàn);(7)結(jié)構(gòu)化輸出:將識(shí)別校驗(yàn)后的文本內(nèi)容結(jié)構(gòu)化,輸出為可編輯的數(shù)據(jù)。本發(fā)明適用于醫(yī)療單證文本檢測(cè)與識(shí)別。??