一種從低質(zhì)量核糖體印跡數(shù)據(jù)預(yù)測(cè)基因編碼框的方法和系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201910407961.7 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110136776A 公開(kāi)(公告)日 2019-08-16
申請(qǐng)公布號(hào) CN110136776A 申請(qǐng)公布日 2019-08-16
分類號(hào) G16B20/00;G16B25/10 分類 物理
發(fā)明人 莫蓓莘;宋波;楊曉玉;高雷;陳雪梅 申請(qǐng)(專利權(quán))人 中佳源物種(深圳)生物科技有限公司
代理機(jī)構(gòu) 深圳市韋恩肯知識(shí)產(chǎn)權(quán)代理有限公司 代理人 深圳大學(xué)
地址 518000 廣東省深圳市南山區(qū)深圳大學(xué)生命與海洋科學(xué)學(xué)院
法律狀態(tài) -

摘要

摘要 本發(fā)明公開(kāi)一種從低質(zhì)量核糖體印跡數(shù)據(jù)預(yù)測(cè)基因編碼框的方法,本發(fā)明綜合利用核糖體印跡和密碼子使用頻率進(jìn)行蛋白編碼框的預(yù)測(cè),利用multitaper算法和復(fù)雜度對(duì)核糖體印跡數(shù)據(jù)質(zhì)量進(jìn)行描述,根據(jù)核糖體印跡數(shù)據(jù)的復(fù)雜度自動(dòng)分配相應(yīng)的權(quán)重,從而平衡數(shù)據(jù)質(zhì)量的影響。具體的,本發(fā)明提取密碼子使用頻率,結(jié)合核糖體印跡數(shù)據(jù)的3堿基周期性,科學(xué)度量核糖體印跡的數(shù)據(jù)質(zhì)量并合理分配相應(yīng)權(quán)重,計(jì)算每個(gè)密碼子位于核糖體P位點(diǎn)的概率,提取序列特征,通過(guò)統(tǒng)計(jì)分析綜合評(píng)定編碼框的預(yù)測(cè)概率值,進(jìn)而預(yù)測(cè)新的編碼框。本發(fā)明將大幅降低對(duì)核糖體印跡數(shù)據(jù)質(zhì)量的要求,將極大促進(jìn)核核體印跡技術(shù)應(yīng)用的拓展,特別是在農(nóng)作物研究中的應(yīng)用。