面向多數(shù)據(jù)源的診療類實(shí)體識(shí)別方法及裝置
基本信息
申請(qǐng)?zhí)?/td> | CN201710101829.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN107122582A | 公開(公告)日 | 2017-09-01 |
申請(qǐng)公布號(hào) | CN107122582A | 申請(qǐng)公布日 | 2017-09-01 |
分類號(hào) | G06F19/00(2011.01)I;G06F17/27(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李雪莉;黃玉麗;關(guān)毅 | 申請(qǐng)(專利權(quán))人 | 黑龍江特士信息技術(shù)有限公司 |
代理機(jī)構(gòu) | 北京三友知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 黑龍江特士信息技術(shù)有限公司;哈爾濱工業(yè)大學(xué) |
地址 | 150000 黑龍江省哈爾濱市經(jīng)開區(qū)哈平路集中區(qū)松花路9號(hào)中國(guó)云谷軟件園1號(hào)樓214室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種面向多數(shù)據(jù)源的診療類實(shí)體識(shí)別方法及裝置,涉及醫(yī)療實(shí)體識(shí)別技術(shù)領(lǐng)域。方法包括:獲取原始數(shù)據(jù)中的待處理語(yǔ)句;將待處理語(yǔ)句進(jìn)行單字切分,確定待處理語(yǔ)句中的每個(gè)文字;根據(jù)預(yù)先訓(xùn)練完成的CRF訓(xùn)練模型,確定待處理語(yǔ)句中的每個(gè)文字在待處理語(yǔ)句中的實(shí)體標(biāo)記,并確定待處理語(yǔ)句的實(shí)體標(biāo)記序列;根據(jù)待處理語(yǔ)句的實(shí)體標(biāo)記序列,確定待處理語(yǔ)句的第一組候選實(shí)體;根據(jù)預(yù)先設(shè)置的診療類術(shù)語(yǔ)切分策略,對(duì)待處理語(yǔ)句進(jìn)行術(shù)語(yǔ)切分,確定第二組候選實(shí)體;對(duì)各候選實(shí)體進(jìn)行篩選,分別形成第一組診療類候選實(shí)體和第二組診療類候選實(shí)體;根據(jù)預(yù)先設(shè)置的判斷策略從第一組診療類候選實(shí)體和第二組診療類候選實(shí)體中確定診療類實(shí)體結(jié)果。 |
