一種病歷文本的文本分類方法及裝置

基本信息

申請?zhí)?/td> CN201810522609.3 申請日 -
公開(公告)號 CN108804591A 公開(公告)日 2018-11-13
申請公布號 CN108804591A 申請公布日 2018-11-13
分類號 G06F17/30 分類 計算;推算;計數(shù);
發(fā)明人 李索恒;陳華官;梁平;張志齊 申請(專利權(quán))人 廣州依圖醫(yī)療技術(shù)有限公司
代理機構(gòu) 北京同達信恒知識產(chǎn)權(quán)代理有限公司 代理人 杭州依圖醫(yī)療技術(shù)有限公司;杭州依圖網(wǎng)絡(luò)科技有限公司;廣州依圖醫(yī)療技術(shù)有限公司;上海依智醫(yī)療技術(shù)有限公司
地址 310000 浙江省杭州市西湖區(qū)轉(zhuǎn)塘科技經(jīng)濟區(qū)塊16號3幢177室
法律狀態(tài) -

摘要

摘要 本發(fā)明實施例涉及數(shù)據(jù)處理技術(shù)領(lǐng)域,尤其涉及一種病歷文本的文本分類方法及裝置,用以根據(jù)文本類型對病歷文本進行分段并輸出每段的文本類型。本發(fā)明實施例包括:確定病歷文本中各文本元素的輸入向量;針對所述病歷文本中的一個文本元素,將所述文本元素的輸入向量轉(zhuǎn)換為所述文本元素的隱層表示,所述隱層表示包含所述病歷文本的信息;根據(jù)所述文本元素的隱層表示,確定所述文本元素對應(yīng)的文本類型;將文本類型相同的連續(xù)的文本元素合并成一個段落,并將文本元素對應(yīng)的文本類型作為所述段落的文本類型。