一種利用二代和三代轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的基因組注釋方法

基本信息

申請(qǐng)?zhí)?/td> CN202010226474.3 申請(qǐng)日 -
公開(公告)號(hào) CN111312331A 公開(公告)日 2020-06-19
申請(qǐng)公布號(hào) CN111312331A 申請(qǐng)公布日 2020-06-19
分類號(hào) G16B20/00(2019.01)I;G16B20/30(2019.01)I 分類 -
發(fā)明人 袁曉輝;劉海平;肖世俊 申請(qǐng)(專利權(quán))人 武漢古奧基因科技有限公司
代理機(jī)構(gòu) 沈陽東大知識(shí)產(chǎn)權(quán)代理有限公司 代理人 武漢古奧基因科技有限公司
地址 430070湖北省武漢市洪山區(qū)珞獅路122號(hào)武漢理工大學(xué)孵化樓B座15樓
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基因組注釋技術(shù)領(lǐng)域,提供一種利用二代和三代轉(zhuǎn)錄組測(cè)序數(shù)據(jù)的基因組注釋方法。本發(fā)明的方法包括下述步驟:步驟1:將三代全長轉(zhuǎn)錄組測(cè)序序列比對(duì)到目標(biāo)基因組,得到各編碼基因的初始結(jié)構(gòu)信息;步驟2:將二代轉(zhuǎn)錄組測(cè)序短序列比對(duì)到目標(biāo)基因組,從比對(duì)文件中提取內(nèi)含子剪切位點(diǎn)信息;步驟3:結(jié)合各編碼基因的初始結(jié)構(gòu)信息和內(nèi)含子剪切位點(diǎn)信息,獲得各編碼基因的最終結(jié)構(gòu)信息。本發(fā)明既能充分利用三代轉(zhuǎn)錄組無須拼接即可得到全長轉(zhuǎn)錄本序列從而準(zhǔn)確性高的優(yōu)點(diǎn),又能充分考慮二代轉(zhuǎn)錄組測(cè)序數(shù)據(jù)能夠提供大量的內(nèi)含子剪切位點(diǎn)證據(jù)的優(yōu)點(diǎn),大大提高了基因組注釋的準(zhǔn)確性和效率。??