基于第三代測(cè)序的多倍體基因組組裝方法和裝置

基本信息

申請(qǐng)?zhí)?/td> CN202010250558.0 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113496760A 公開(kāi)(公告)日 2021-10-12
申請(qǐng)公布號(hào) CN113496760A 申請(qǐng)公布日 2021-10-12
分類號(hào) G16B20/10(2019.01)I;G16B30/10(2019.01)I;G16B30/20(2019.01)I 分類 物理
發(fā)明人 賀麗娟;楊林峰;徐煜;楊鑫;鄧天全;高強(qiáng) 申請(qǐng)(專利權(quán))人 深圳華大基因科技服務(wù)有限公司
代理機(jī)構(gòu) 深圳鼎合誠(chéng)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 羅瑤;彭家恩
地址 518083廣東省深圳市鹽田區(qū)北山工業(yè)區(qū)綜合樓科技創(chuàng)業(yè)園201
法律狀態(tài) -

摘要

摘要 一種基于第三代測(cè)序的多倍體基因組組裝方法和裝置,該方法包括:獲取多倍體基因組的三代單分子測(cè)序數(shù)據(jù)并進(jìn)行數(shù)據(jù)糾錯(cuò)和組裝得到第一組裝結(jié)果;將測(cè)序數(shù)據(jù)比對(duì)到第一組裝結(jié)果進(jìn)行深度評(píng)估并統(tǒng)計(jì)對(duì)整個(gè)基因組的覆蓋度以獲得組裝出單拷貝和多拷貝的區(qū)域;選取組裝出多拷貝的區(qū)域的序列進(jìn)行序列之間的比對(duì)以去除覆蓋在多拷貝區(qū)域內(nèi)的序列之間的重復(fù)得到第一輪去冗余結(jié)果;鑒定并打斷可能的錯(cuò)誤連接后對(duì)基因組序列重新拼接以去除基因組上的拼接問(wèn)題得到第二組裝結(jié)果;確定去冗余成功后將第一組裝結(jié)果中未包含到第二組裝結(jié)果的部分序列合并到第二組裝結(jié)果,然后進(jìn)行優(yōu)化和矯正得到第三組裝結(jié)果。本發(fā)明能夠有效地從復(fù)雜多倍體中分離出單套染色體組。