利用納米孔測序數(shù)據(jù)的高原多倍體魚類基因組注釋方法

基本信息

申請?zhí)?/td> CN202010226518.2 申請日 -
公開(公告)號 CN111445949A 公開(公告)日 2020-07-24
申請公布號 CN111445949A 申請公布日 2020-07-24
分類號 G16B20/10(2019.01)I 分類 -
發(fā)明人 袁曉輝;劉海平;肖世俊 申請(專利權(quán))人 武漢古奧基因科技有限公司
代理機(jī)構(gòu) 沈陽東大知識產(chǎn)權(quán)代理有限公司 代理人 武漢古奧基因科技有限公司
地址 430070湖北省武漢市洪山區(qū)珞獅路122號武漢理工大學(xué)孵化樓B座15樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基因組注釋技術(shù)領(lǐng)域,提供一種利用納米孔測序數(shù)據(jù)的高原多倍體魚類基因組注釋方法,包括:步驟1:基于納米孔測序技術(shù)獲得待注釋高原多倍體魚的全長轉(zhuǎn)錄組序列;步驟2:采用n種基因組預(yù)測方法分別預(yù)測待注釋高原多倍體魚可能的蛋白編碼基因;步驟3:將全長轉(zhuǎn)錄組序列作為參考序列,將每種基因組預(yù)測方法預(yù)測得到的每個蛋白編碼基因與參考序列進(jìn)行比對,計算每個蛋白編碼基因相對參考序列的重疊率、重疊相似度;步驟4:過濾掉重疊率和重疊相似度均低于相應(yīng)閾值的蛋白編碼基因,對剩下的蛋白編碼基因進(jìn)行整合,得到最終的預(yù)測基因集。本發(fā)明能夠提高高原多倍體魚類基因組注釋的準(zhǔn)確性和可靠性,降低基因組注釋的成本。??