基于單詞的類內(nèi)分布與類間分布的電子病歷特征選擇方法
基本信息
申請?zhí)?/td> | CN201810208599.6 | 申請日 | - |
公開(公告)號 | CN108346474A | 公開(公告)日 | 2018-07-31 |
申請公布號 | CN108346474A | 申請公布日 | 2018-07-31 |
分類號 | G16H50/70;G06F17/27 | 分類 | 物理 |
發(fā)明人 | 彭訪;方勝群;蔡志平;吳喜軍;孫文成 | 申請(專利權(quán))人 | 湖南省藍(lán)蜻蜓網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 湖南省國防科技工業(yè)局專利中心 | 代理人 | 馮青 |
地址 | 410073 湖南省長沙市開福區(qū)德雅路109號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及基于單詞的類內(nèi)分布與類間分布的電子病歷特征選擇方法。本發(fā)明首先構(gòu)建了疾病、藥品詞典,其次總結(jié)了中文病歷中癥狀詞分布的三大特點(diǎn),然后對收集到的病人病歷進(jìn)行預(yù)處理,將分詞結(jié)果保存到數(shù)據(jù)庫中。本發(fā)明根據(jù)關(guān)鍵癥狀詞在疾病內(nèi)的分布情況及疾病間的分布情況計(jì)算單詞對于不同疾病的代表度,且在考慮疾病間分布情況時(shí),分析了疾病與疾病間的關(guān)聯(lián)性對于特征選擇的影響,在特征選擇時(shí)保證關(guān)聯(lián)性高的疾病間的特征盡量相似,關(guān)聯(lián)性低的疾病間的特征盡量排斥。 |
