RNA序列編碼潛力預(yù)測方法及系統(tǒng)

基本信息

申請?zhí)?/td> CN202210419773.8 申請日 -
公開(公告)號 CN114694757A 公開(公告)日 2022-07-01
申請公布號 CN114694757A 申請公布日 2022-07-01
分類號 G16B40/00(2019.01)I;G16B40/20(2019.01)I;G16B25/00(2019.01)I;G16B20/00(2019.01)I;G06K9/62(2022.01)I 分類 物理
發(fā)明人 諶先敢;陽小飛;李臣鴻;陳素;林顯光 申請(專利權(quán))人 中南民族大學(xué)
代理機(jī)構(gòu) 武漢智權(quán)專利代理事務(wù)所(特殊普通合伙) 代理人 -
地址 430000湖北省武漢市洪山區(qū)民族大道182號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種RNA序列編碼潛力預(yù)測方法及系統(tǒng)。該方法包括:從訓(xùn)練樣本集合中選取ORF長度小于303nt的編碼RNA作為待增強(qiáng)樣本;對待增強(qiáng)樣本進(jìn)行數(shù)據(jù)增強(qiáng)處理,得到36類不同的偽RNA序列;將36類不同的偽RNA序列與原始訓(xùn)練數(shù)據(jù)結(jié)合,得到36個(gè)訓(xùn)練集合;通過36個(gè)訓(xùn)練集合訓(xùn)練36個(gè)基礎(chǔ)分類器,得到36個(gè)基礎(chǔ)分類模型;將36個(gè)基礎(chǔ)分類模型的輸出結(jié)果串聯(lián)成36維特征向量;從36維特征向量中選取結(jié)果特征向量;將結(jié)果特征向量以及標(biāo)簽輸入最終分類器進(jìn)行訓(xùn)練,得到RNA序列編碼潛力預(yù)測模型,通過RNA序列編碼潛力預(yù)測模型進(jìn)行RNA序列編碼潛力預(yù)測。通過本發(fā)明,提高了RNA序列編碼潛力預(yù)測準(zhǔn)確性。