一種基因組測序數(shù)據(jù)序列組裝方法

基本信息

申請?zhí)?/td> CN201410096283.4 申請日 -
公開(公告)號 CN104750765A 公開(公告)日 2015-07-01
申請公布號 CN104750765A 申請公布日 2015-07-01
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 孫際賓;李澎鵬;鄭平;馬延和 申請(專利權(quán))人 天工生物科技(天津)有限公司
代理機(jī)構(gòu) 天津?yàn)I??凭曋R產(chǎn)權(quán)代理有限公司 代理人 韓敏
地址 300308 天津市濱海新區(qū)自貿(mào)試驗(yàn)區(qū)(空港經(jīng)濟(jì)區(qū))中環(huán)西路86號匯盈產(chǎn)業(yè)園8號樓1-201-A218
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供了一種基因組測序數(shù)據(jù)序列組裝方法,可以整合從頭測序和重測序的算法的優(yōu)點(diǎn),實(shí)現(xiàn)基因組測序數(shù)據(jù)序列的高效組裝。已知測序數(shù)據(jù)比對到一參考序列后生成的一基于參考序列獲得的基因組測序序列的擬定序列遍歷路徑以及基因組測序數(shù)據(jù)的重疊關(guān)系集合:該集合包括“確定”關(guān)系子集和“不確定”關(guān)系子集。該方法包括:將測序數(shù)據(jù)序列比對到一個近緣參考基因組后獲得一個基于參考序列獲得的基因組測序序列的擬定序列遍歷路徑,逐個檢查擬定序列遍歷路徑中的每個節(jié)點(diǎn),根據(jù)重疊關(guān)系集合的“確定”關(guān)系子集和/或“不確定”關(guān)系子集中的連接關(guān)系來對擬定序列遍歷路徑進(jìn)行迭代修正,并更新重疊關(guān)系集合;基于更新后的擬定序列遍歷路徑以及重疊關(guān)系集合,檢查下一個節(jié)點(diǎn),直至最后一個節(jié)點(diǎn)。