一種從低質(zhì)量核糖體印跡數(shù)據(jù)預(yù)測基因編碼框的方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910407961.7 申請日 -
公開(公告)號 CN110136776B 公開(公告)日 2021-04-20
申請公布號 CN110136776B 申請公布日 2021-04-20
分類號 G16B20/00(2019.01)I;G16B25/10(2019.01)I 分類 物理
發(fā)明人 莫蓓莘;宋波;楊曉玉;高雷;陳雪梅 申請(專利權(quán))人 中佳源物種(深圳)生物科技有限公司
代理機構(gòu) 深圳市韋恩肯知識產(chǎn)權(quán)代理有限公司 代理人 李華雙;黃昌平
地址 518000 廣東省深圳市龍華區(qū)觀瀾街道新瀾社區(qū)觀光路1301號銀星科技大廈D1002
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種從低質(zhì)量核糖體印跡數(shù)據(jù)預(yù)測基因編碼框的方法,本發(fā)明綜合利用核糖體印跡和密碼子使用頻率進(jìn)行蛋白編碼框的預(yù)測,利用multitaper算法和復(fù)雜度對核糖體印跡數(shù)據(jù)質(zhì)量進(jìn)行描述,根據(jù)核糖體印跡數(shù)據(jù)的復(fù)雜度自動分配相應(yīng)的權(quán)重,從而平衡數(shù)據(jù)質(zhì)量的影響。具體的,本發(fā)明提取密碼子使用頻率,結(jié)合核糖體印跡數(shù)據(jù)的3堿基周期性,科學(xué)度量核糖體印跡的數(shù)據(jù)質(zhì)量并合理分配相應(yīng)權(quán)重,計算每個密碼子位于核糖體P位點的概率,提取序列特征,通過統(tǒng)計分析綜合評定編碼框的預(yù)測概率值,進(jìn)而預(yù)測新的編碼框。本發(fā)明將大幅降低對核糖體印跡數(shù)據(jù)質(zhì)量的要求,將極大促進(jìn)核核體印跡技術(shù)應(yīng)用的拓展,特別是在農(nóng)作物研究中的應(yīng)用。??