一種基于LSTM-CRF的中醫(yī)臨床醫(yī)案癥狀命名實體抽取系統(tǒng)

基本信息

申請?zhí)?/td> CN202111279393.0 申請日 -
公開(公告)號 CN113962227A 公開(公告)日 2022-01-21
申請公布號 CN113962227A 申請公布日 2022-01-21
分類號 G06F40/295(2020.01)I;G06N3/04(2006.01)I;G06F16/35(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 林麗開;李剛;丁海雁 申請(專利權)人 南京醫(yī)路云數(shù)字科技研究院有限公司
代理機構 - 代理人 -
地址 210000江蘇省南京市江北新區(qū)星火路10號鼎業(yè)百泰生物大樓二期C座408室
法律狀態(tài) -

摘要

摘要 本發(fā)明屬于中醫(yī)臨床技術領域,尤其為一種基于LSTM?CRF的中醫(yī)臨床醫(yī)案癥狀命名實體抽取系統(tǒng),包括LSTM?CRF網(wǎng)絡模型,所述LSTM?CRF網(wǎng)絡模型包括輸入層、特征提取層、LSTM層和CRF層;所述輸入層用于獲取中醫(yī)臨床醫(yī)案癥狀的文本信息;所述特征提取層用于對輸入的文本信息的每一個字進行特征提取,并制定特征模板;所述LSTM層用于自動提取文字的特征;所述CRF層用于文字級別的序列標注,生成最優(yōu)標注序列;本發(fā)明的命名實體抽取系統(tǒng),利用新型的LSTM?CRF網(wǎng)絡模型,并將輸入的詞條信息分成獨立的文字,并且將文字按照偏旁部首的不同進行分類,大大提升了分詞和字性標記的性能,識別能力大大提高,對于復雜實體也能夠較為精準的識別和標記,降低了系統(tǒng)的錯誤率。