基于深度學(xué)習(xí)的MHC-I表位親和力預(yù)測(cè)方法

基本信息

申請(qǐng)?zhí)?/td> CN202010539194.8 申請(qǐng)日 -
公開(公告)號(hào) CN112002374A 公開(公告)日 2020-11-27
申請(qǐng)公布號(hào) CN112002374A 申請(qǐng)公布日 2020-11-27
分類號(hào) G16B40/00(2019.01)I 分類 物理
發(fā)明人 任樹成;宋瑾;張恒輝;沈?qū)?/td> 申請(qǐng)(專利權(quán))人 北京臻知醫(yī)學(xué)科技有限責(zé)任公司
代理機(jī)構(gòu) 北京中珒知識(shí)產(chǎn)權(quán)代理事務(wù)所(特殊普通合伙) 代理人 北京臻知醫(yī)學(xué)科技有限責(zé)任公司
地址 102600北京市大興區(qū)中關(guān)村科技園區(qū)大興生物醫(yī)藥產(chǎn)業(yè)基地寶參南街16號(hào)院2號(hào)樓2層201-2
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種基于深度學(xué)習(xí)的MHC?I表位親和力預(yù)測(cè)方法,其包括:通過公共數(shù)據(jù)庫(kù)獲取多數(shù)個(gè)多肽;根據(jù)MHC?I分子與肽的結(jié)合方式將所述多肽轉(zhuǎn)換為21mer肽;提取所述多肽的特征,所述特征包括:序列特征、親水性特征、極性特征和位置特征;分別對(duì)所述多肽的特征進(jìn)行特征編碼,得到4*21維的特征矩陣;將所述公共數(shù)據(jù)庫(kù)中的多肽數(shù)據(jù)作為訓(xùn)練集進(jìn)行模型訓(xùn)練,根據(jù)所述多肽的等位基因的分類,分別將所述多肽的特征矩陣輸入預(yù)先建立的CNN模型建立預(yù)測(cè)模型,建立的預(yù)測(cè)模型的數(shù)量與所述多肽的等位基因的分類數(shù)據(jù)相對(duì)應(yīng);使用所述公共數(shù)據(jù)庫(kù)的多肽數(shù)據(jù)作為所述預(yù)測(cè)模型的驗(yàn)證集進(jìn)行結(jié)合親和力測(cè)試。通過本申請(qǐng)能夠有效預(yù)測(cè)MHC?I表位親和力,預(yù)測(cè)準(zhǔn)確性較高且更穩(wěn)定。??