一種基因組測(cè)序數(shù)據(jù)序列組裝方法

基本信息

申請(qǐng)?zhí)?/td> CN201410096283.4 申請(qǐng)日 -
公開(公告)號(hào) CN104750765B 公開(公告)日 2017-10-03
申請(qǐng)公布號(hào) CN104750765B 申請(qǐng)公布日 2017-10-03
分類號(hào) G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫際賓;李澎鵬;鄭平;馬延和 申請(qǐng)(專利權(quán))人 天工生物科技(天津)有限公司
代理機(jī)構(gòu) 天津?yàn)I??凭曋R(shí)產(chǎn)權(quán)代理有限公司 代理人 韓敏
地址 300308 天津市濱海新區(qū)自貿(mào)試驗(yàn)區(qū)(空港經(jīng)濟(jì)區(qū))中環(huán)西路86號(hào)匯盈產(chǎn)業(yè)園8號(hào)樓1-201-A218
法律狀態(tài) -

摘要

摘要 本發(fā)明實(shí)施例提供了一種基因組測(cè)序數(shù)據(jù)序列組裝方法,可以整合從頭測(cè)序和重測(cè)序的算法的優(yōu)點(diǎn),實(shí)現(xiàn)基因組測(cè)序數(shù)據(jù)序列的高效組裝。已知測(cè)序數(shù)據(jù)比對(duì)到一參考序列后生成的一基于參考序列獲得的基因組測(cè)序序列的擬定序列遍歷路徑以及基因組測(cè)序數(shù)據(jù)的重疊關(guān)系集合:該集合包括“確定”關(guān)系子集和“不確定”關(guān)系子集。該方法包括:將測(cè)序數(shù)據(jù)序列比對(duì)到一個(gè)近緣參考基因組后獲得一個(gè)基于參考序列獲得的基因組測(cè)序序列的擬定序列遍歷路徑,逐個(gè)檢查擬定序列遍歷路徑中的每個(gè)節(jié)點(diǎn),根據(jù)重疊關(guān)系集合的“確定”關(guān)系子集和/或“不確定”關(guān)系子集中的連接關(guān)系來(lái)對(duì)擬定序列遍歷路徑進(jìn)行迭代修正,并更新重疊關(guān)系集合;基于更新后的擬定序列遍歷路徑以及重疊關(guān)系集合,檢查下一個(gè)節(jié)點(diǎn),直至最后一個(gè)節(jié)點(diǎn)。