一種利用基因組數(shù)據(jù)探究疾病亞型親緣性的方法

基本信息

申請(qǐng)?zhí)?/td> CN202010469680.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111653312B 公開(kāi)(公告)日 2021-04-16
申請(qǐng)公布號(hào) CN111653312B 申請(qǐng)公布日 2021-04-16
分類(lèi)號(hào) G16B20/20(2019.01)I;G16B40/00(2019.01)I;G16B20/50(2019.01)I;G16B30/10(2019.01)I 分類(lèi) 物理
發(fā)明人 侯群星;袁衛(wèi)蘭;高軍暉;林靈;吳昊天;蔣麗莎;李無(wú)霜;王瑤瑤;吳守信;許騁 申請(qǐng)(專(zhuān)利權(quán))人 上海寶藤生物醫(yī)藥科技股份有限公司
代理機(jī)構(gòu) 北京品源專(zhuān)利代理有限公司 代理人 鞏克棟
地址 201203上海市浦東新區(qū)中國(guó)(上海)自由貿(mào)易試驗(yàn)區(qū)張衡路180弄3號(hào)樓5層
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種利用基因組數(shù)據(jù)探究疾病亞型親緣性的方法,所述方法包括采用超幾何分布檢驗(yàn)計(jì)算基因非沉默突變富集值的步驟;所述基因非沉默突變富集值的計(jì)算公式為:其中,nf為基因在疾病亞型中發(fā)生非沉默突變的樣本數(shù),Nf為基因在所有樣本中發(fā)生非沉默突變的樣本數(shù),n為疾病亞型樣本數(shù),N為樣本總數(shù);所述疾病亞型的分組數(shù)量不小于3。本發(fā)明在進(jìn)行疾病亞型親緣性分析之前,首先利用超幾何分布檢驗(yàn)計(jì)算基因在各腫瘤亞型中的非沉默突變富集分?jǐn)?shù),再利用此富集分?jǐn)?shù)進(jìn)行親緣性分析,減小了樣本總數(shù)、疾病亞型樣本數(shù)等背景因素對(duì)分析結(jié)果造成的影響,提高了方法的準(zhǔn)確性。??