基于深度遷移的對(duì)HLA抗原呈遞預(yù)測(cè)系統(tǒng)的增強(qiáng)方法

基本信息

申請(qǐng)?zhí)?/td> CN202111204491.8 申請(qǐng)日 -
公開(公告)號(hào) CN113762417A 公開(公告)日 2021-12-07
申請(qǐng)公布號(hào) CN113762417A 申請(qǐng)公布日 2021-12-07
分類號(hào) G06K9/62(2006.01)I;G06N3/04(2006.01)I;G06N3/08(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 方榯楷;費(fèi)才溢;徐實(shí) 申請(qǐng)(專利權(quán))人 南京澄實(shí)生物科技有限公司
代理機(jī)構(gòu) 南京天華專利代理有限責(zé)任公司 代理人 劉暢;傅婷婷
地址 210000江蘇省南京市江北新區(qū)探秘路73號(hào)樹屋十六棟D-2棟2層209室
法律狀態(tài) -

摘要

摘要 本發(fā)明提出了一種基于深度遷移的對(duì)HLA抗原呈遞預(yù)測(cè)系統(tǒng)的增強(qiáng)方法,包括:1)使用全局最大差異打分矩陣生成不同比例的負(fù)樣本訓(xùn)練集:正負(fù)樣本均衡的源域數(shù)據(jù)集,正負(fù)樣本失衡的目標(biāo)數(shù)據(jù)集2)采用多種不同的深度神經(jīng)網(wǎng)絡(luò)來編碼已知序列信息、多模態(tài)特征融合等手段,在正負(fù)樣本比均衡的源域數(shù)據(jù)上得到預(yù)訓(xùn)練模型3)通過深度遷移方法,將預(yù)訓(xùn)練模型遷移至正負(fù)樣本比極端失衡的目標(biāo)數(shù)據(jù)集4)提出創(chuàng)新的“嚴(yán)格準(zhǔn)確率(strict PPV)”指標(biāo)。同于以往其他基于單一數(shù)據(jù)集與單一人工智能模型的MHC預(yù)測(cè)方法,本發(fā)明能高效地融合多模態(tài)信息,快速部署遷移到不用的數(shù)據(jù)集上,節(jié)省了在新環(huán)境與數(shù)據(jù)上重新訓(xùn)練模型的算力與時(shí)間成本。