一種跨病種的小樣本臨床醫(yī)療文本后結(jié)構(gòu)化處理方法

基本信息

申請?zhí)?/td> CN202011567629.6 申請日 -
公開(公告)號 CN112685561A 公開(公告)日 2021-04-20
申請公布號 CN112685561A 申請公布日 2021-04-20
分類號 G06F16/35(2019.01)I;G06N3/04(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 劉翔 申請(專利權(quán))人 廣州知匯云科技有限公司
代理機構(gòu) 汕頭興邦華騰專利代理事務(wù)所(特殊普通合伙) 代理人 張樹峰;梁鳳德
地址 510000廣東省廣州市南沙區(qū)進港大道8號南沙城大廈11樓06號(僅限辦公)
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種跨病種的小樣本臨床醫(yī)療文本后結(jié)構(gòu)化處理方法,包括:獲取A病種的小樣本文本信息和B病種的大樣本文本信息,并采用文本困惑度的文本聚類獲取待標(biāo)注信息,對待標(biāo)注信息進行標(biāo)注,得到標(biāo)注后的文本信息;在pytorch神經(jīng)網(wǎng)絡(luò)框架下,利用元學(xué)習(xí)和LSTM模型訓(xùn)練是否型問題的信息抽取模型,得到元模型;利用標(biāo)注后的文本信息對元模型進行訓(xùn)練,得到小樣本病歷的文本后結(jié)構(gòu)化模型;利用文本后結(jié)構(gòu)化模型識別的A病種的文本信息。通過上述方案,本發(fā)明具有邏輯簡單、標(biāo)注量少、覆蓋全面、處理效率高等優(yōu)點,在中文自然語言處理技術(shù)以及機器學(xué)習(xí)領(lǐng)域具有很高的實用價值和推廣價值。??