一種基于多連體特征的T細(xì)胞受體對應(yīng)表位預(yù)測方法

基本信息

申請?zhí)?/td> CN202010198109.6 申請日 -
公開(公告)號 CN111429965A 公開(公告)日 2020-07-17
申請公布號 CN111429965A 申請公布日 2020-07-17
分類號 G16B15/30;G16B30/10;G16B40/00 分類 -
發(fā)明人 王嘉寅;童瑤;楊玲;鄭田;劉濤;李敏;張選平 申請(專利權(quán))人 北京吉因加科技有限公司
代理機(jī)構(gòu) 西安通大專利代理有限責(zé)任公司 代理人 北京吉因加科技有限公司;西安交通大學(xué)
地址 710049 陜西省西安市咸寧西路28號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于多連體特征的T細(xì)胞受體對應(yīng)表位預(yù)測方法,將CDR3β鏈以及對應(yīng)的表位解析為長度3的堿基,統(tǒng)計每種三聯(lián)體的頻次作為初始特征;根據(jù)得到的初始特征建立初始特征矩陣,使用主成分分析法對初始特征矩陣進(jìn)行降維,進(jìn)行特征提?。辉O(shè)有n個訓(xùn)練樣本,輸入預(yù)測數(shù)據(jù)x后,訓(xùn)練得到梯度提升決策樹模型,通過梯度提升決策樹模型將各個決策樹的決策結(jié)果線性組合起來做出預(yù)測;將特征數(shù)據(jù)輸入訓(xùn)練好的模型中進(jìn)行預(yù)測,根據(jù)不同的預(yù)測目的選擇不同的預(yù)測指標(biāo)。本發(fā)明僅使用三聯(lián)體的統(tǒng)計值作為初始特征,結(jié)合梯度提升決策樹模型能夠在極短的時間內(nèi)完成模型的訓(xùn)練,且預(yù)測的準(zhǔn)確度更高。