一種跨病種的小樣本臨床醫(yī)療文本后結(jié)構(gòu)化處理方法
基本信息
申請?zhí)?/td> | CN202011567629.6 | 申請日 | - |
公開(公告)號 | CN112685561A | 公開(公告)日 | 2021-04-20 |
申請公布號 | CN112685561A | 申請公布日 | 2021-04-20 |
分類號 | G06F16/35(2019.01)I;G06N3/04(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 劉翔 | 申請(專利權(quán))人 | 廣州知匯云科技有限公司 |
代理機構(gòu) | 汕頭興邦華騰專利代理事務(wù)所(特殊普通合伙) | 代理人 | 張樹峰;梁鳳德 |
地址 | 510000廣東省廣州市南沙區(qū)進港大道8號南沙城大廈11樓06號(僅限辦公) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種跨病種的小樣本臨床醫(yī)療文本后結(jié)構(gòu)化處理方法,包括:獲取A病種的小樣本文本信息和B病種的大樣本文本信息,并采用文本困惑度的文本聚類獲取待標(biāo)注信息,對待標(biāo)注信息進行標(biāo)注,得到標(biāo)注后的文本信息;在pytorch神經(jīng)網(wǎng)絡(luò)框架下,利用元學(xué)習(xí)和LSTM模型訓(xùn)練是否型問題的信息抽取模型,得到元模型;利用標(biāo)注后的文本信息對元模型進行訓(xùn)練,得到小樣本病歷的文本后結(jié)構(gòu)化模型;利用文本后結(jié)構(gòu)化模型識別的A病種的文本信息。通過上述方案,本發(fā)明具有邏輯簡單、標(biāo)注量少、覆蓋全面、處理效率高等優(yōu)點,在中文自然語言處理技術(shù)以及機器學(xué)習(xí)領(lǐng)域具有很高的實用價值和推廣價值。?? |
