一種基于多基因風(fēng)險(xiǎn)打分構(gòu)建疾病分類模型的方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110355345.9 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113066586A | 公開(公告)日 | 2021-07-02 |
申請(qǐng)公布號(hào) | CN113066586A | 申請(qǐng)公布日 | 2021-07-02 |
分類號(hào) | G16H50/70;G16H50/30;G06K9/62;G06N3/04;G06N3/08 | 分類 | 物理 |
發(fā)明人 | 馬玉昆;孫瓊琳;溫顏華;張曉偉;顏紅;李偉華 | 申請(qǐng)(專利權(quán))人 | 北京果殼生物科技有限公司 |
代理機(jī)構(gòu) | 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 閆書寧 |
地址 | 102206 北京市昌平區(qū)中關(guān)村生命科學(xué)園生命園路8號(hào)院6號(hào)樓8層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多基因風(fēng)險(xiǎn)打分構(gòu)建疾病分類模型的方法。該方法包括如下步驟:獲取人群目標(biāo)疾病的GWAS統(tǒng)計(jì)數(shù)據(jù)文件,對(duì)位點(diǎn)進(jìn)行質(zhì)控;獲取訓(xùn)練集和檢驗(yàn)集的全基因組的位點(diǎn)基因型及樣品的疾病狀態(tài),基于訓(xùn)練集和檢驗(yàn)集的全基因組位點(diǎn)分型數(shù)據(jù)分別對(duì)樣品和位點(diǎn)進(jìn)行質(zhì)控,通過質(zhì)控的樣品及位點(diǎn)將被用于后續(xù)分析;根據(jù)不同策略篩選位點(diǎn)集合或調(diào)整位點(diǎn)效應(yīng)值,采用五種不同方法的不同參數(shù)分別進(jìn)行計(jì)算樣品PRS;基于訓(xùn)練集樣品的PRS和疾病狀態(tài)構(gòu)建疾病分類模型,并在檢驗(yàn)集樣品中驗(yàn)證疾病分類模型的效能,選擇檢驗(yàn)集中最優(yōu)模型作為疾病預(yù)測(cè)器。本發(fā)明提供的方法可以幫助臨床早期發(fā)現(xiàn)、預(yù)防目標(biāo)疾病,具有重要的應(yīng)用價(jià)值。 |
