一種基于多基因風(fēng)險(xiǎn)打分構(gòu)建疾病分類模型的方法

基本信息

申請(qǐng)?zhí)?/td> CN202110355345.9 申請(qǐng)日 -
公開(公告)號(hào) CN113066586A 公開(公告)日 2021-07-02
申請(qǐng)公布號(hào) CN113066586A 申請(qǐng)公布日 2021-07-02
分類號(hào) G16H50/70;G16H50/30;G06K9/62;G06N3/04;G06N3/08 分類 物理
發(fā)明人 馬玉昆;孫瓊琳;溫顏華;張曉偉;顏紅;李偉華 申請(qǐng)(專利權(quán))人 北京果殼生物科技有限公司
代理機(jī)構(gòu) 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 代理人 閆書寧
地址 102206 北京市昌平區(qū)中關(guān)村生命科學(xué)園生命園路8號(hào)院6號(hào)樓8層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多基因風(fēng)險(xiǎn)打分構(gòu)建疾病分類模型的方法。該方法包括如下步驟:獲取人群目標(biāo)疾病的GWAS統(tǒng)計(jì)數(shù)據(jù)文件,對(duì)位點(diǎn)進(jìn)行質(zhì)控;獲取訓(xùn)練集和檢驗(yàn)集的全基因組的位點(diǎn)基因型及樣品的疾病狀態(tài),基于訓(xùn)練集和檢驗(yàn)集的全基因組位點(diǎn)分型數(shù)據(jù)分別對(duì)樣品和位點(diǎn)進(jìn)行質(zhì)控,通過質(zhì)控的樣品及位點(diǎn)將被用于后續(xù)分析;根據(jù)不同策略篩選位點(diǎn)集合或調(diào)整位點(diǎn)效應(yīng)值,采用五種不同方法的不同參數(shù)分別進(jìn)行計(jì)算樣品PRS;基于訓(xùn)練集樣品的PRS和疾病狀態(tài)構(gòu)建疾病分類模型,并在檢驗(yàn)集樣品中驗(yàn)證疾病分類模型的效能,選擇檢驗(yàn)集中最優(yōu)模型作為疾病預(yù)測(cè)器。本發(fā)明提供的方法可以幫助臨床早期發(fā)現(xiàn)、預(yù)防目標(biāo)疾病,具有重要的應(yīng)用價(jià)值。