一種面向醫(yī)療領(lǐng)域基于深度學(xué)習(xí)的命名實體識別方法

基本信息

申請?zhí)?/td> CN201610590151.6 申請日 -
公開(公告)號 CN106202054B 公開(公告)日 2018-12-14
申請公布號 CN106202054B 申請公布日 2018-12-14
分類號 G06F17/27;G16H70/40 分類 計算;推算;計數(shù);
發(fā)明人 朱聰慧;趙鐵軍;楊沐昀;徐冰;曹海龍;鄭德權(quán) 申請(專利權(quán))人 哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司
代理機構(gòu) 哈爾濱市松花江專利商標(biāo)事務(wù)所 代理人 哈爾濱工業(yè)大學(xué);哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司;深圳高性能醫(yī)療器械國家研究院有限公司
地址 150001 黑龍江省哈爾濱市南崗區(qū)西大直街92號
法律狀態(tài) -

摘要

摘要 一種面向醫(yī)療領(lǐng)域基于深度學(xué)習(xí)的命名實體識別方法,本發(fā)明涉及命名實體識別方法。本發(fā)明是要解決CRF模型由于不考慮語義信息,在訓(xùn)練語料極度缺乏的情況下,標(biāo)注結(jié)果中會出現(xiàn)大量的無意義的標(biāo)注結(jié)果的問題,而提出的一種面向醫(yī)療領(lǐng)域基于深度學(xué)習(xí)的命名實體識別方法。該方法是通過一、得到了補充醫(yī)療領(lǐng)域語料的詞表voc和詞表voc對應(yīng)的詞向量vec;二、利用有標(biāo)注語料中的訓(xùn)練語料進(jìn)行長短期記憶單元網(wǎng)絡(luò)LSTM的訓(xùn)練;三、根據(jù)二中的更新的神經(jīng)網(wǎng)絡(luò)參數(shù)θ進(jìn)行標(biāo)注結(jié)果的路徑查找,得到有標(biāo)注語料的標(biāo)注結(jié)果;利用命名實體識別評估標(biāo)準(zhǔn)F值對有標(biāo)注語料中的測試語料的標(biāo)注結(jié)果進(jìn)行評估等步驟實現(xiàn)的。本發(fā)明應(yīng)用于命名實體識別領(lǐng)域。