一種病歷文本的自然語(yǔ)言結(jié)構(gòu)化方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201810524555.4 申請(qǐng)日 -
公開(公告)號(hào) CN108733837B 公開(公告)日 2021-04-27
申請(qǐng)公布號(hào) CN108733837B 申請(qǐng)公布日 2021-04-27
分類號(hào) G06F16/35;G16H50/70;G06F40/289;G06N3/04;G06N3/08 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李索恒;陳華官;梁平;張志齊 申請(qǐng)(專利權(quán))人 廣州依圖醫(yī)療技術(shù)有限公司
代理機(jī)構(gòu) 北京同達(dá)信恒知識(shí)產(chǎn)權(quán)代理有限公司 代理人 黃志華
地址 200336 上海市長(zhǎng)寧區(qū)婁山關(guān)路523號(hào)23樓06、07單元
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種病歷文本的自然語(yǔ)言結(jié)構(gòu)化方法及裝置,用以靈活調(diào)整待提取項(xiàng)的內(nèi)容而無需重新訓(xùn)練整個(gè)系統(tǒng)。本發(fā)明實(shí)施例包括:確定病歷文本中各文本元素的輸入向量;針對(duì)至少一個(gè)文本元素,利用神經(jīng)網(wǎng)絡(luò)根據(jù)所述病歷文本中文本元素的輸入向量確定所述文本元素的隱層表示,所述隱層表示包含所述文本元素的上下文信息;確定所述病歷文本中各文本元素的隱層表示與術(shù)語(yǔ)庫(kù)中待提取項(xiàng)的關(guān)聯(lián)性,根據(jù)關(guān)聯(lián)性確定所述病歷文本中的目標(biāo)文本元素,所述目標(biāo)文本元素為與所述待提取項(xiàng)對(duì)應(yīng)的文本元素;根據(jù)所述目標(biāo)文本元素的隱層表示,確定所述待提取項(xiàng)的輸出內(nèi)容。