一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實體抽取系統(tǒng)
基本信息
申請?zhí)?/td> | CN202111279393.0 | 申請日 | - |
公開(公告)號 | CN113962227A | 公開(公告)日 | 2022-01-21 |
申請公布號 | CN113962227A | 申請公布日 | 2022-01-21 |
分類號 | G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06F16/35(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 林麗開;李剛;丁海雁 | 申請(專利權)人 | 南京醫(yī)路云數(shù)字科技研究院有限公司 |
代理機構 | - | 代理人 | - |
地址 | 210000江蘇省南京市江北新區(qū)星火路10號鼎業(yè)百泰生物大樓二期C座408室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明屬于中醫(yī)臨床技術領域,尤其為一種基于LSTM?CRF的中醫(yī)臨床醫(yī)案癥狀命名實體抽取系統(tǒng),包括LSTM?CRF網(wǎng)絡模型,所述LSTM?CRF網(wǎng)絡模型包括輸入層、特征提取層、LSTM層和CRF層;所述輸入層用于獲取中醫(yī)臨床醫(yī)案癥狀的文本信息;所述特征提取層用于對輸入的文本信息的每一個字進行特征提取,并制定特征模板;所述LSTM層用于自動提取文字的特征;所述CRF層用于文字級別的序列標注,生成最優(yōu)標注序列;本發(fā)明的命名實體抽取系統(tǒng),利用新型的LSTM?CRF網(wǎng)絡模型,并將輸入的詞條信息分成獨立的文字,并且將文字按照偏旁部首的不同進行分類,大大提升了分詞和字性標記的性能,識別能力大大提高,對于復雜實體也能夠較為精準的識別和標記,降低了系統(tǒng)的錯誤率。 |
