一種基因組測(cè)序數(shù)據(jù)序列組裝方法
基本信息
申請(qǐng)?zhí)?/td> | CN201410096283.4 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN104750765B | 公開(公告)日 | 2017-10-03 |
申請(qǐng)公布號(hào) | CN104750765B | 申請(qǐng)公布日 | 2017-10-03 |
分類號(hào) | G06F17/30(2006.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孫際賓;李澎鵬;鄭平;馬延和 | 申請(qǐng)(專利權(quán))人 | 天工生物科技(天津)有限公司 |
代理機(jī)構(gòu) | 天津?yàn)I??凭曋R(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 韓敏 |
地址 | 300308 天津市濱海新區(qū)自貿(mào)試驗(yàn)區(qū)(空港經(jīng)濟(jì)區(qū))中環(huán)西路86號(hào)匯盈產(chǎn)業(yè)園8號(hào)樓1-201-A218 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明實(shí)施例提供了一種基因組測(cè)序數(shù)據(jù)序列組裝方法,可以整合從頭測(cè)序和重測(cè)序的算法的優(yōu)點(diǎn),實(shí)現(xiàn)基因組測(cè)序數(shù)據(jù)序列的高效組裝。已知測(cè)序數(shù)據(jù)比對(duì)到一參考序列后生成的一基于參考序列獲得的基因組測(cè)序序列的擬定序列遍歷路徑以及基因組測(cè)序數(shù)據(jù)的重疊關(guān)系集合:該集合包括“確定”關(guān)系子集和“不確定”關(guān)系子集。該方法包括:將測(cè)序數(shù)據(jù)序列比對(duì)到一個(gè)近緣參考基因組后獲得一個(gè)基于參考序列獲得的基因組測(cè)序序列的擬定序列遍歷路徑,逐個(gè)檢查擬定序列遍歷路徑中的每個(gè)節(jié)點(diǎn),根據(jù)重疊關(guān)系集合的“確定”關(guān)系子集和/或“不確定”關(guān)系子集中的連接關(guān)系來(lái)對(duì)擬定序列遍歷路徑進(jìn)行迭代修正,并更新重疊關(guān)系集合;基于更新后的擬定序列遍歷路徑以及重疊關(guān)系集合,檢查下一個(gè)節(jié)點(diǎn),直至最后一個(gè)節(jié)點(diǎn)。 |
