利用三代全長轉(zhuǎn)錄組的高原多倍體魚類基因組注釋方法

基本信息

申請?zhí)?/td> CN202010226496.X 申請日 -
公開(公告)號 CN111445947A 公開(公告)日 2020-07-24
申請公布號 CN111445947A 申請公布日 2020-07-24
分類號 G16B20/10(2019.01)I 分類 -
發(fā)明人 袁曉輝;劉海平;肖世俊 申請(專利權(quán))人 武漢古奧基因科技有限公司
代理機(jī)構(gòu) 沈陽東大知識產(chǎn)權(quán)代理有限公司 代理人 武漢古奧基因科技有限公司
地址 430070湖北省武漢市洪山區(qū)珞獅路122號武漢理工大學(xué)孵化樓B座15樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基因組注釋技術(shù)領(lǐng)域,提供一種利用三代全長轉(zhuǎn)錄組的高原多倍體魚類基因組注釋方法,包括:步驟1:將三代全長轉(zhuǎn)錄組測序序列比對到基因組,得到初始比對文件;步驟2:采用n種基因組預(yù)測方法分別預(yù)測可能的蛋白編碼基因,得到n個(gè)比對文件;步驟3:根據(jù)比對文件提取外顯子序列并比對到基因組,得到每種方法下各編碼基因的結(jié)構(gòu)信息;從初始比對文件中提取內(nèi)含子剪切位點(diǎn)信息;結(jié)合每種方法下各編碼基因的結(jié)構(gòu)信息和內(nèi)含子剪切位點(diǎn)信息,得到改進(jìn)的蛋白編碼序列;整合n種方法下改進(jìn)的蛋白編碼序列得到預(yù)測基因集。本發(fā)明能夠同時(shí)利用三代全長轉(zhuǎn)錄組的高準(zhǔn)確性及其提供的內(nèi)含子剪切位點(diǎn)信息,提高了高原多倍體魚類基因組注釋的準(zhǔn)確性。??