一種醫(yī)療病理報(bào)告圖片的文本結(jié)構(gòu)化處理系統(tǒng)和方法

基本信息

申請(qǐng)?zhí)?/td> CN202011029211.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112185520A 公開(kāi)(公告)日 2021-01-05
申請(qǐng)公布號(hào) CN112185520A 申請(qǐng)公布日 2021-01-05
分類(lèi)號(hào) G16H30/20;G06F16/35;G06F40/232;G06F40/242;G06F40/295;G06K9/20;G06N3/04;G06N3/08 分類(lèi) 物理
發(fā)明人 駱佳俊;魏博;馬素芬;許永超;李力行;凌少平 申請(qǐng)(專(zhuān)利權(quán))人 志諾維思(北京)基因科技有限公司
代理機(jī)構(gòu) 北京超凡宏宇專(zhuān)利代理事務(wù)所(特殊普通合伙) 代理人 志諾維思(北京)基因科技有限公司
地址 102200 北京市昌平區(qū)沙河鎮(zhèn)能源東路1號(hào)院1號(hào)樓3層309-3
法律狀態(tài) -

摘要

摘要 本申請(qǐng)?zhí)峁┝艘环N醫(yī)療病理報(bào)告圖片的文本結(jié)構(gòu)化處理系統(tǒng)和方法,其中,該系統(tǒng)包括:文本識(shí)別模塊,用于對(duì)醫(yī)療病理報(bào)告圖片進(jìn)行文本識(shí)別,并對(duì)識(shí)別出的字詞進(jìn)行糾錯(cuò)處理,得到病理文本;文本切割模塊,用于將病理文本切割為結(jié)構(gòu)化文本和非結(jié)構(gòu)化文本;字典匹配模塊和模型預(yù)測(cè)模塊,用于確定第一和第二醫(yī)療指標(biāo)名實(shí)體數(shù)據(jù)結(jié)構(gòu);策略融合模塊,用于對(duì)其進(jìn)行融合得到醫(yī)療指標(biāo)名實(shí)體;數(shù)據(jù)封裝模塊,用于封裝醫(yī)療指標(biāo)名實(shí)體和結(jié)構(gòu)化文本;策略歸一化模塊,用于對(duì)封裝結(jié)果進(jìn)行策略歸一化處理和推理,得到醫(yī)療病理報(bào)告圖片的結(jié)構(gòu)化文本。本申請(qǐng)可提高圖文識(shí)別的準(zhǔn)確率,在醫(yī)療病理信息系統(tǒng)中更加方便快捷的實(shí)現(xiàn)了數(shù)據(jù)抽取、結(jié)構(gòu)化、存儲(chǔ)等多個(gè)業(yè)務(wù)需求。