基于第三代測(cè)序的多倍體基因組組裝方法和裝置
基本信息
申請(qǐng)?zhí)?/td> | CN202010250558.0 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN113496760A | 公開(kāi)(公告)日 | 2021-10-12 |
申請(qǐng)公布號(hào) | CN113496760A | 申請(qǐng)公布日 | 2021-10-12 |
分類號(hào) | G16B20/10(2019.01)I;G16B30/10(2019.01)I;G16B30/20(2019.01)I | 分類 | 物理 |
發(fā)明人 | 賀麗娟;楊林峰;徐煜;楊鑫;鄧天全;高強(qiáng) | 申請(qǐng)(專利權(quán))人 | 深圳華大基因科技服務(wù)有限公司 |
代理機(jī)構(gòu) | 深圳鼎合誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 羅瑤;彭家恩 |
地址 | 518083廣東省深圳市鹽田區(qū)北山工業(yè)區(qū)綜合樓科技創(chuàng)業(yè)園201 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種基于第三代測(cè)序的多倍體基因組組裝方法和裝置,該方法包括:獲取多倍體基因組的三代單分子測(cè)序數(shù)據(jù)并進(jìn)行數(shù)據(jù)糾錯(cuò)和組裝得到第一組裝結(jié)果;將測(cè)序數(shù)據(jù)比對(duì)到第一組裝結(jié)果進(jìn)行深度評(píng)估并統(tǒng)計(jì)對(duì)整個(gè)基因組的覆蓋度以獲得組裝出單拷貝和多拷貝的區(qū)域;選取組裝出多拷貝的區(qū)域的序列進(jìn)行序列之間的比對(duì)以去除覆蓋在多拷貝區(qū)域內(nèi)的序列之間的重復(fù)得到第一輪去冗余結(jié)果;鑒定并打斷可能的錯(cuò)誤連接后對(duì)基因組序列重新拼接以去除基因組上的拼接問(wèn)題得到第二組裝結(jié)果;確定去冗余成功后將第一組裝結(jié)果中未包含到第二組裝結(jié)果的部分序列合并到第二組裝結(jié)果,然后進(jìn)行優(yōu)化和矯正得到第三組裝結(jié)果。本發(fā)明能夠有效地從復(fù)雜多倍體中分離出單套染色體組。 |
