基于自然語言處理的醫(yī)學(xué)診斷文本分析標(biāo)注方法

基本信息

申請?zhí)?/td> CN202010446982.2 申請日 -
公開(公告)號 CN113705228A 公開(公告)日 2021-11-26
申請公布號 CN113705228A 申請公布日 2021-11-26
分類號 G06F40/289(2020.01)I;G06F40/30(2020.01)I;G06F16/903(2019.01)I;G06F16/35(2019.01)I;G06F16/36(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 高鵬;金呂軍;黃權(quán)力;桂璐 申請(專利權(quán))人 中金慈云健康科技有限公司
代理機(jī)構(gòu) - 代理人 -
地址 100176北京市北京經(jīng)濟(jì)技術(shù)開發(fā)區(qū)博興八路1號2幢2118室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了基于自然語言處理的醫(yī)學(xué)診斷文本分析標(biāo)注方法,包括以下步驟:S1、對醫(yī)學(xué)診斷文本進(jìn)行中文分詞處理,得到醫(yī)學(xué)分詞序列;S2、對醫(yī)學(xué)分詞序列進(jìn)行專用詞性標(biāo)注和醫(yī)學(xué)語義識別處理,得到標(biāo)準(zhǔn)化陽性斷語并集;S3、對標(biāo)準(zhǔn)化陽性斷語集進(jìn)行標(biāo)簽轉(zhuǎn)化處理,得到醫(yī)學(xué)診斷文本的陽性標(biāo)簽集。本發(fā)明的基于自然語言處理的醫(yī)學(xué)診斷文本分析標(biāo)注方法,通過自然語言處理技術(shù)結(jié)合多部位醫(yī)學(xué)專用詞庫,針對不同醫(yī)學(xué)部位采用相應(yīng)的部位詞庫來進(jìn)行分別處理,并通過正則表達(dá)式語義識別模型進(jìn)行分析理解,使得對醫(yī)學(xué)診斷文本的識別精確率指標(biāo)達(dá)到100%,同時召回率指標(biāo)達(dá)到80%以上。