一種基于多連體特征的T細(xì)胞受體對應(yīng)表位預(yù)測方法
基本信息
申請?zhí)?/td> | CN202010198109.6 | 申請日 | - |
公開(公告)號 | CN111429965A | 公開(公告)日 | 2020-07-17 |
申請公布號 | CN111429965A | 申請公布日 | 2020-07-17 |
分類號 | G16B15/30;G16B30/10;G16B40/00 | 分類 | - |
發(fā)明人 | 王嘉寅;童瑤;楊玲;鄭田;劉濤;李敏;張選平 | 申請(專利權(quán))人 | 北京吉因加科技有限公司 |
代理機(jī)構(gòu) | 西安通大專利代理有限責(zé)任公司 | 代理人 | 北京吉因加科技有限公司;西安交通大學(xué) |
地址 | 710049 陜西省西安市咸寧西路28號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于多連體特征的T細(xì)胞受體對應(yīng)表位預(yù)測方法,將CDR3β鏈以及對應(yīng)的表位解析為長度3的堿基,統(tǒng)計每種三聯(lián)體的頻次作為初始特征;根據(jù)得到的初始特征建立初始特征矩陣,使用主成分分析法對初始特征矩陣進(jìn)行降維,進(jìn)行特征提?。辉O(shè)有n個訓(xùn)練樣本,輸入預(yù)測數(shù)據(jù)x后,訓(xùn)練得到梯度提升決策樹模型,通過梯度提升決策樹模型將各個決策樹的決策結(jié)果線性組合起來做出預(yù)測;將特征數(shù)據(jù)輸入訓(xùn)練好的模型中進(jìn)行預(yù)測,根據(jù)不同的預(yù)測目的選擇不同的預(yù)測指標(biāo)。本發(fā)明僅使用三聯(lián)體的統(tǒng)計值作為初始特征,結(jié)合梯度提升決策樹模型能夠在極短的時間內(nèi)完成模型的訓(xùn)練,且預(yù)測的準(zhǔn)確度更高。 |
