基于單詞的類內(nèi)分布與類間分布的電子病歷特征選擇方法

基本信息

申請?zhí)?/td> CN201810208599.6 申請日 -
公開(公告)號 CN108346474B 公開(公告)日 2021-09-28
申請公布號 CN108346474B 申請公布日 2021-09-28
分類號 G16H50/70(2018.01)I;G06F40/289(2020.01)I;G06F40/30(2020.01)I 分類 物理
發(fā)明人 彭訪;方勝群;蔡志平;吳喜軍;孫文成 申請(專利權(quán))人 湖南省藍(lán)蜻蜓網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 湖南省國防科技工業(yè)局專利中心 代理人 馮青
地址 410073 湖南省長沙市開福區(qū)德雅路109號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基于單詞的類內(nèi)分布與類間分布的電子病歷特征選擇方法。本發(fā)明首先構(gòu)建了疾病、藥品詞典,其次總結(jié)了中文病歷中癥狀詞分布的三大特點,然后對收集到的病人病歷進(jìn)行預(yù)處理,將分詞結(jié)果保存到數(shù)據(jù)庫中。本發(fā)明根據(jù)關(guān)鍵癥狀詞在疾病內(nèi)的分布情況及疾病間的分布情況計算單詞對于不同疾病的代表度,且在考慮疾病間分布情況時,分析了疾病與疾病間的關(guān)聯(lián)性對于特征選擇的影響,在特征選擇時保證關(guān)聯(lián)性高的疾病間的特征盡量相似,關(guān)聯(lián)性低的疾病間的特征盡量排斥。