利用三代全長轉(zhuǎn)錄組的高原多倍體魚類基因組注釋方法
基本信息
申請?zhí)?/td> | CN202010226496.X | 申請日 | - |
公開(公告)號 | CN111445947A | 公開(公告)日 | 2020-07-24 |
申請公布號 | CN111445947A | 申請公布日 | 2020-07-24 |
分類號 | G16B20/10(2019.01)I | 分類 | - |
發(fā)明人 | 袁曉輝;劉海平;肖世俊 | 申請(專利權(quán))人 | 武漢古奧基因科技有限公司 |
代理機(jī)構(gòu) | 沈陽東大知識產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢古奧基因科技有限公司 |
地址 | 430070湖北省武漢市洪山區(qū)珞獅路122號武漢理工大學(xué)孵化樓B座15樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及基因組注釋技術(shù)領(lǐng)域,提供一種利用三代全長轉(zhuǎn)錄組的高原多倍體魚類基因組注釋方法,包括:步驟1:將三代全長轉(zhuǎn)錄組測序序列比對到基因組,得到初始比對文件;步驟2:采用n種基因組預(yù)測方法分別預(yù)測可能的蛋白編碼基因,得到n個(gè)比對文件;步驟3:根據(jù)比對文件提取外顯子序列并比對到基因組,得到每種方法下各編碼基因的結(jié)構(gòu)信息;從初始比對文件中提取內(nèi)含子剪切位點(diǎn)信息;結(jié)合每種方法下各編碼基因的結(jié)構(gòu)信息和內(nèi)含子剪切位點(diǎn)信息,得到改進(jìn)的蛋白編碼序列;整合n種方法下改進(jìn)的蛋白編碼序列得到預(yù)測基因集。本發(fā)明能夠同時(shí)利用三代全長轉(zhuǎn)錄組的高準(zhǔn)確性及其提供的內(nèi)含子剪切位點(diǎn)信息,提高了高原多倍體魚類基因組注釋的準(zhǔn)確性。?? |
