一種高維特征空間中基于聚類算法的就診人群分組方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010469507.7 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111738304A | 公開(公告)日 | 2020-10-02 |
申請(qǐng)公布號(hào) | CN111738304A | 申請(qǐng)公布日 | 2020-10-02 |
分類號(hào) | G06K9/62(2006.01)I;G16H10/00(2018.01)I | 分類 | - |
發(fā)明人 | 陳明東;黃越 | 申請(qǐng)(專利權(quán))人 | 思派健康產(chǎn)業(yè)投資有限公司 |
代理機(jī)構(gòu) | 北京市盛峰律師事務(wù)所 | 代理人 | 思派健康產(chǎn)業(yè)投資有限公司 |
地址 | 510700廣東省廣州市黃埔區(qū)中新廣州知識(shí)產(chǎn)權(quán)騰飛一街2號(hào)619房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種高維特征空間中基于聚類算法的就診人群分組方法,所述方法包括以下步驟,S1、以患者為匯總維度進(jìn)行聚類前的特征提取,提取的特征包括疾病種類、限額使用率、個(gè)人自費(fèi)占比、有無住院以及就診間隔;S2、計(jì)算各個(gè)特征之間的相關(guān)性,依次判斷各個(gè)相關(guān)性是否大于設(shè)定閾值,若是,則剔除該相關(guān)性對(duì)應(yīng)的特征,并執(zhí)行步驟S3;若否,則直接執(zhí)行步驟S3;S3、獲取聚類算法中的最優(yōu)選擇聚類數(shù);S4、將最優(yōu)選擇聚類數(shù)輸入聚類算法中,對(duì)步驟S2中的特征進(jìn)行聚類,并對(duì)聚類結(jié)果分別進(jìn)行業(yè)務(wù)解釋。優(yōu)點(diǎn)是:本方法中的聚類算法能夠?qū)lbow方法中的損失函數(shù)進(jìn)行歸一化,且引入了類外和的概念,用以刻畫描述聚類后不同類之間的距離遠(yuǎn)近。?? |
