一種蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN202011585063.X 申請(qǐng)日 -
公開(公告)號(hào) CN112289370B 公開(公告)日 2021-03-23
申請(qǐng)公布號(hào) CN112289370B 申請(qǐng)公布日 2021-03-23
分類號(hào) G16B15/00(2019.01)I;G16B40/00(2019.01)I;G06N3/04(2006.01)I 分類 物理
發(fā)明人 華權(quán)高;趙海義;舒芹 申請(qǐng)(專利權(quán))人 武漢金開瑞生物工程有限公司
代理機(jī)構(gòu) 武漢藍(lán)寶石專利代理事務(wù)所(特殊普通合伙) 代理人 劉璐
地址 430000湖北省武漢市東湖開發(fā)區(qū)高新大道666號(hào)武漢國(guó)家生物產(chǎn)業(yè)基地項(xiàng)目B、C、D區(qū)研發(fā)樓B1樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于多任務(wù)時(shí)域卷積神經(jīng)網(wǎng)絡(luò)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法及裝置,其方法包括:獲取目的基因序列,以及蛋白質(zhì)數(shù)據(jù)庫(kù);根據(jù)遺傳密碼表和蛋白質(zhì)數(shù)據(jù)庫(kù)建立每個(gè)蛋白質(zhì)對(duì)應(yīng)的DNA?RNA?氨基酸三元序列數(shù)據(jù)集;根據(jù)蛋白質(zhì)數(shù)據(jù)庫(kù)中的氨基酸的殘基深度、物理化學(xué)性質(zhì)建立多元回歸方程,得到每個(gè)蛋白質(zhì)的統(tǒng)計(jì)深度特征;將所述三元序列數(shù)據(jù)集進(jìn)行聚類并映射為多維特征向量;將所述多維特征向量、蛋白質(zhì)的統(tǒng)計(jì)深度特征作為多任務(wù)時(shí)域卷積神經(jīng)網(wǎng)絡(luò)的輸入,訓(xùn)練所述多任務(wù)時(shí)域卷積神經(jīng)網(wǎng)絡(luò);利用蛋白質(zhì)的統(tǒng)計(jì)深度特征預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)。本發(fā)明將蛋白質(zhì)的統(tǒng)計(jì)深度特征與多任務(wù)時(shí)域卷積神經(jīng)網(wǎng)絡(luò)結(jié)合,減少模型的復(fù)雜度,提高了泛化性、擬合度。??