一種對(duì)特征豐度數(shù)據(jù)和樣本表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析的方法

基本信息

申請(qǐng)?zhí)?/td> CN202110388456.X 申請(qǐng)日 -
公開(公告)號(hào) CN112965971A 公開(公告)日 2021-06-15
申請(qǐng)公布號(hào) CN112965971A 申請(qǐng)公布日 2021-06-15
分類號(hào) G06F16/215(2019.01)I;G06F16/28(2019.01)I;G16C20/70(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 馬玉昆;張曉偉;王帥;白曉剛;李峰峰;孫瓊琳;李偉華 申請(qǐng)(專利權(quán))人 北京果殼生物科技有限公司
代理機(jī)構(gòu) 北京紀(jì)凱知識(shí)產(chǎn)權(quán)代理有限公司 代理人 冀志華
地址 102206北京市昌平區(qū)中關(guān)村生命科學(xué)園生命園路8號(hào)院6號(hào)樓8層
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種對(duì)特征豐度數(shù)據(jù)和樣本表型數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析的方法,其特征在于,包括如下步驟:(1)獲取特征豐度數(shù)據(jù)矩陣和樣本表型數(shù)據(jù)矩陣,并同時(shí)對(duì)這兩個(gè)數(shù)據(jù)矩陣進(jìn)行預(yù)處理;(2)對(duì)預(yù)處理后的特征豐度數(shù)據(jù)矩陣和樣本表型數(shù)據(jù)矩陣進(jìn)行LASSO回歸,過濾掉回歸過程中,回歸系數(shù)被LASSO回歸模型壓縮為0的特征和樣本;(3)計(jì)算剩余特征豐度數(shù)據(jù)矩陣中特征之間以及樣本表型數(shù)據(jù)矩陣中樣本之間的相關(guān)系數(shù),并將相關(guān)性未達(dá)到預(yù)設(shè)閾值的特征和樣本進(jìn)行過濾;(4)對(duì)最終剩余的特征豐度數(shù)據(jù)矩陣與樣本表型數(shù)據(jù)矩陣進(jìn)行線性回歸分析,最終得到特征豐度數(shù)據(jù)矩陣中和樣本表型數(shù)據(jù)有關(guān)聯(lián)的特征。本發(fā)明可以廣泛應(yīng)用于生物學(xué)數(shù)據(jù)分析領(lǐng)域。