RNA序列編碼潛力預(yù)測(cè)方法及系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202210419773.8 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN114694757A | 公開(kāi)(公告)日 | 2022-07-01 |
申請(qǐng)公布號(hào) | CN114694757A | 申請(qǐng)公布日 | 2022-07-01 |
分類號(hào) | G16B40/00(2019.01)I;G16B40/20(2019.01)I;G16B25/00(2019.01)I;G16B20/00(2019.01)I;G06K9/62(2022.01)I | 分類 | 物理 |
發(fā)明人 | 諶先敢;陽(yáng)小飛;李臣鴻;陳素;林顯光 | 申請(qǐng)(專利權(quán))人 | 中南民族大學(xué) |
代理機(jī)構(gòu) | 武漢智權(quán)專利代理事務(wù)所(特殊普通合伙) | 代理人 | - |
地址 | 430000湖北省武漢市洪山區(qū)民族大道182號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種RNA序列編碼潛力預(yù)測(cè)方法及系統(tǒng)。該方法包括:從訓(xùn)練樣本集合中選取ORF長(zhǎng)度小于303nt的編碼RNA作為待增強(qiáng)樣本;對(duì)待增強(qiáng)樣本進(jìn)行數(shù)據(jù)增強(qiáng)處理,得到36類不同的偽RNA序列;將36類不同的偽RNA序列與原始訓(xùn)練數(shù)據(jù)結(jié)合,得到36個(gè)訓(xùn)練集合;通過(guò)36個(gè)訓(xùn)練集合訓(xùn)練36個(gè)基礎(chǔ)分類器,得到36個(gè)基礎(chǔ)分類模型;將36個(gè)基礎(chǔ)分類模型的輸出結(jié)果串聯(lián)成36維特征向量;從36維特征向量中選取結(jié)果特征向量;將結(jié)果特征向量以及標(biāo)簽輸入最終分類器進(jìn)行訓(xùn)練,得到RNA序列編碼潛力預(yù)測(cè)模型,通過(guò)RNA序列編碼潛力預(yù)測(cè)模型進(jìn)行RNA序列編碼潛力預(yù)測(cè)。通過(guò)本發(fā)明,提高了RNA序列編碼潛力預(yù)測(cè)準(zhǔn)確性。 |
