癌癥篩查模型、癌癥篩查模型的構(gòu)建方法及構(gòu)建裝置

基本信息

申請(qǐng)?zhí)?/td> CN202110707095.0 申請(qǐng)日 -
公開(公告)號(hào) CN113257360A 公開(公告)日 2021-08-13
申請(qǐng)公布號(hào) CN113257360A 申請(qǐng)公布日 2021-08-13
分類號(hào) G16B40/20(2019.01)I;G16B40/00(2019.01)I;G16B20/20(2019.01)I;G16H50/20(2018.01)I;G16H50/70(2018.01)I;G06K9/62(2006.01)I 分類 物理
發(fā)明人 曹善柏;周濤;張萌萌;郭璟;孫宏;樓峰 申請(qǐng)(專利權(quán))人 北京橡鑫生物科技有限公司
代理機(jī)構(gòu) 北京康信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 金田蘊(yùn)
地址 102600北京市大興區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)科創(chuàng)十三街18號(hào)院5號(hào)樓16層1601
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種癌癥篩查模型、癌癥篩查模型的構(gòu)建方法及構(gòu)建裝置。該構(gòu)建方法包括以下步驟:基于不同的數(shù)據(jù)構(gòu)建不同的CNV baseline;分別利用不同的CNV baseline對(duì)待檢測(cè)樣本的sWGS數(shù)據(jù)進(jìn)行CNV檢測(cè),獲取多個(gè)基因組特征;利用待檢測(cè)樣本的sWGS數(shù)據(jù)建立訓(xùn)練集與測(cè)試集,將各個(gè)基因組特征的數(shù)值做ROC曲線,選擇AUC值最大的基因組特征作為最終基因組特征;對(duì)最終基因組特征進(jìn)行模型訓(xùn)練,獲得癌癥篩查模型。本發(fā)明通過納入sWGS情況下,基于不同baseline數(shù)據(jù)獲得多個(gè)基因組特征,建立訓(xùn)練集與測(cè)試集,通過機(jī)器學(xué)習(xí)的方法,建立癌癥篩查模型,提高癌癥(早期)篩查的準(zhǔn)確性。