單菌DNA文庫測序數(shù)據(jù)的注釋方法及相關設備

基本信息

申請?zhí)?/td> CN202111388983.7 申請日 -
公開(公告)號 CN114360647A 公開(公告)日 2022-04-15
申請公布號 CN114360647A 申請公布日 2022-04-15
分類號 G16B30/10(2019.01)I;G16B30/20(2019.01)I;G16B40/00(2019.01)I;G16B50/00(2019.01)I 分類 物理
發(fā)明人 葛琳娜;楊海生;李明壯 申請(專利權)人 榮聯(lián)科技集團股份有限公司
代理機構 北京風雅頌專利代理有限公司 代理人 鄭穎穎
地址 100080北京市海淀區(qū)北四環(huán)西路56號10層1002-1
法律狀態(tài) -

摘要

摘要 本申請?zhí)峁┮环N單菌DNA文庫測序數(shù)據(jù)的注釋方法、裝置、電子設備及存儲介質。注釋方法包括:對原始測序數(shù)據(jù)進行堿基質量評估、接頭序列過濾、低質量序列過濾和低質量堿基過濾,得到高質量的序列數(shù)據(jù);同時基于多種組裝方法分別拼接高質量的序列數(shù)據(jù),評估得到最優(yōu)拼接序列數(shù)據(jù);進行基因組結構預測、重復序列分析和CRISPR結構分析,得到最優(yōu)拼接序列的預測結果信息;分別將最優(yōu)拼接序列與多種功能數(shù)據(jù)庫進行比對,得到最優(yōu)拼接序列的功能注釋信息。能夠充分考慮各個分析環(huán)節(jié)的資源需求和分析時間等因素,具有良好的分析效率、任務調度、內存和線程分配等性能,能夠高效的得到全面且可靠的單菌DNA文庫測序數(shù)據(jù)的注釋信息。