基于預(yù)訓(xùn)練語言模型的蛋白質(zhì)構(gòu)象感知表示學(xué)習(xí)方法
基本信息
申請?zhí)?/td> | CN202210122014.5 | 申請日 | - |
公開(公告)號 | CN114678061A | 公開(公告)日 | 2022-06-28 |
申請公布號 | CN114678061A | 申請公布日 | 2022-06-28 |
分類號 | G16B5/00(2019.01)I;G16B35/00(2019.01)I;G16B40/00(2019.01)I;G06K9/62(2022.01)I | 分類 | 物理 |
發(fā)明人 | 張強;王澤元;韓玉強;陳華鈞 | 申請(專利權(quán))人 | 浙江大學(xué)杭州國際科創(chuàng)中心 |
代理機構(gòu) | 杭州天勤知識產(chǎn)權(quán)代理有限公司 | 代理人 | - |
地址 | 311200浙江省杭州市蕭山區(qū)建設(shè)三路733號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于預(yù)訓(xùn)練語言模型的蛋白質(zhì)構(gòu)象感知表示學(xué)習(xí)方法,包括:獲取由氨基酸序列組成的蛋白質(zhì),根據(jù)蛋白質(zhì)構(gòu)象構(gòu)建不同數(shù)據(jù)集,為每類蛋白質(zhì)構(gòu)象定義提示符;基于預(yù)訓(xùn)練語言模型構(gòu)建表示學(xué)習(xí)模塊,用于將每類提示符的嵌入表示融合到蛋白質(zhì)的嵌入表示,以得到提示符標(biāo)識下的蛋白質(zhì)嵌入表示;構(gòu)建任務(wù)模塊,用于針對每類蛋白質(zhì)構(gòu)象對應(yīng)的任務(wù),基于提示符標(biāo)識下的蛋白質(zhì)嵌入表示進行任務(wù)預(yù)測;基于任務(wù)預(yù)測結(jié)果和標(biāo)簽構(gòu)建每類任務(wù)的損失函數(shù),結(jié)合所有類任務(wù)的損失函數(shù)和不同數(shù)據(jù)集,更新表示學(xué)習(xí)模塊和任務(wù)模塊的模型參數(shù);模型參數(shù)更新結(jié)束后,提取表示學(xué)習(xí)模塊作為蛋白質(zhì)表示模塊。該方法能夠得到不同構(gòu)象下的蛋白質(zhì)表示。 |
