癌癥篩查模型、癌癥篩查模型的構(gòu)建方法及構(gòu)建裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202110707095.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113257360A | 公開(公告)日 | 2021-08-13 |
申請(qǐng)公布號(hào) | CN113257360A | 申請(qǐng)公布日 | 2021-08-13 |
分類號(hào) | G16B40/20(2019.01)I;G16B40/00(2019.01)I;G16B20/20(2019.01)I;G16H50/20(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I | 分類 | 物理 |
發(fā)明人 | 曹善柏;周濤;張萌萌;郭璟;孫宏;樓峰 | 申請(qǐng)(專利權(quán))人 | 北京橡鑫生物科技有限公司 |
代理機(jī)構(gòu) | 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 金田蘊(yùn) |
地址 | 102600北京市大興區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)科創(chuàng)十三街18號(hào)院5號(hào)樓16層1601 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種癌癥篩查模型、癌癥篩查模型的構(gòu)建方法及構(gòu)建裝置。該構(gòu)建方法包括以下步驟:基于不同的數(shù)據(jù)構(gòu)建不同的CNV baseline;分別利用不同的CNV baseline對(duì)待檢測(cè)樣本的sWGS數(shù)據(jù)進(jìn)行CNV檢測(cè),獲取多個(gè)基因組特征;利用待檢測(cè)樣本的sWGS數(shù)據(jù)建立訓(xùn)練集與測(cè)試集,將各個(gè)基因組特征的數(shù)值做ROC曲線,選擇AUC值最大的基因組特征作為最終基因組特征;對(duì)最終基因組特征進(jìn)行模型訓(xùn)練,獲得癌癥篩查模型。本發(fā)明通過納入sWGS情況下,基于不同baseline數(shù)據(jù)獲得多個(gè)基因組特征,建立訓(xùn)練集與測(cè)試集,通過機(jī)器學(xué)習(xí)的方法,建立癌癥篩查模型,提高癌癥(早期)篩查的準(zhǔn)確性。 |
