基于預(yù)訓(xùn)練語言模型的蛋白質(zhì)構(gòu)象感知表示學(xué)習(xí)方法

基本信息

申請?zhí)?/td> CN202210122014.5 申請日 -
公開(公告)號 CN114678061A 公開(公告)日 2022-06-28
申請公布號 CN114678061A 申請公布日 2022-06-28
分類號 G16B5/00(2019.01)I;G16B35/00(2019.01)I;G16B40/00(2019.01)I;G06K9/62(2022.01)I 分類 物理
發(fā)明人 張強;王澤元;韓玉強;陳華鈞 申請(專利權(quán))人 浙江大學(xué)杭州國際科創(chuàng)中心
代理機構(gòu) 杭州天勤知識產(chǎn)權(quán)代理有限公司 代理人 -
地址 311200浙江省杭州市蕭山區(qū)建設(shè)三路733號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基于預(yù)訓(xùn)練語言模型的蛋白質(zhì)構(gòu)象感知表示學(xué)習(xí)方法,包括:獲取由氨基酸序列組成的蛋白質(zhì),根據(jù)蛋白質(zhì)構(gòu)象構(gòu)建不同數(shù)據(jù)集,為每類蛋白質(zhì)構(gòu)象定義提示符;基于預(yù)訓(xùn)練語言模型構(gòu)建表示學(xué)習(xí)模塊,用于將每類提示符的嵌入表示融合到蛋白質(zhì)的嵌入表示,以得到提示符標(biāo)識下的蛋白質(zhì)嵌入表示;構(gòu)建任務(wù)模塊,用于針對每類蛋白質(zhì)構(gòu)象對應(yīng)的任務(wù),基于提示符標(biāo)識下的蛋白質(zhì)嵌入表示進行任務(wù)預(yù)測;基于任務(wù)預(yù)測結(jié)果和標(biāo)簽構(gòu)建每類任務(wù)的損失函數(shù),結(jié)合所有類任務(wù)的損失函數(shù)和不同數(shù)據(jù)集,更新表示學(xué)習(xí)模塊和任務(wù)模塊的模型參數(shù);模型參數(shù)更新結(jié)束后,提取表示學(xué)習(xí)模塊作為蛋白質(zhì)表示模塊。該方法能夠得到不同構(gòu)象下的蛋白質(zhì)表示。