一種面向多數(shù)據(jù)源的癥狀體征類實體識別方法及裝置
基本信息
申請?zhí)?/td> | CN201710103706.4 | 申請日 | - |
公開(公告)號 | CN106897559B | 公開(公告)日 | 2019-09-17 |
申請公布號 | CN106897559B | 申請公布日 | 2019-09-17 |
分類號 | G16H50/20(2018.01)I; G06F16/33(2019.01)I; G06F17/27(2006.01)I | 分類 | 物理 |
發(fā)明人 | 李雪莉; 關毅; 黃玉麗 | 申請(專利權)人 | 黑龍江特士信息技術有限公司 |
代理機構 | 北京三友知識產權代理有限公司 | 代理人 | 黑龍江特士信息技術有限公司;哈爾濱工業(yè)大學;易?;ヂ?lián)醫(yī)療信息科技(北京)有限公司 |
地址 | 150000 黑龍江省哈爾濱市經開區(qū)哈平路集中區(qū)松花路9號中國云谷軟件園1號樓214室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種面向多數(shù)據(jù)源的癥狀體征類實體識別方法及裝置,涉及醫(yī)療實體識別技術領域。方法包括:獲取原始數(shù)據(jù)中的待處理語句;將待處理語句進行單字切分,確定每個文字;根據(jù)預先訓練完成的CRF訓練模型,確定待處理語句中的每個文字在待處理語句中的實體標記,并確定待處理語句的實體標記序列;根據(jù)待處理語句的實體標記序列,確定待處理語句的第一組候選實體;根據(jù)預先設置的癥狀體征類術語切分策略,對待處理語句進行術語切分,確定第二組候選實體;對各候選實體進行篩選,分別形成第一組癥狀體征類候選實體和第二組癥狀體征類候選實體;根據(jù)預先設置的判斷策略確定癥狀體征類實體結果。 |
