一種基于Pacbiosubreads和Hi-Creads的全基因組分型方法
基本信息
申請?zhí)?/td> | CN202010441252.3 | 申請日 | - |
公開(公告)號 | CN111816248A | 公開(公告)日 | 2020-10-23 |
申請公布號 | CN111816248A | 申請公布日 | 2020-10-23 |
分類號 | G16B20/00(2019.01)I | 分類 | 物理 |
發(fā)明人 | 盧銳 | 申請(專利權(quán))人 | 武漢菲沙基因信息有限公司 |
代理機構(gòu) | 上海精晟知識產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢菲沙基因信息有限公司 |
地址 | 430000湖北省武漢市東湖高新技術(shù)開發(fā)區(qū)高新大道666號武漢國家生物產(chǎn)業(yè)基地項目B、C、D區(qū)研發(fā)樓B1棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于Pacbio subreads和Hi?C reads的全基因組分型方法,包括以下步驟:1)準備參考基因組;2)將二代測序數(shù)據(jù)比對到參考基因組,檢測出各染色體的所有SNP位點;3)將Hi?C建庫測序數(shù)據(jù)比對到參考基因組,結(jié)合SNP位點,采用HapCUT2構(gòu)建連鎖SNP群;4)基于MVP Block對Pacbio subreads進行分組,然后再分別組裝,最終獲取到每條染色單體序列;5)對親本基因組進行全基因組測序,將測序結(jié)果比對到上步分出的染色單體序列上,按照比對結(jié)果將染色單體分為兩組,對應(yīng)父母本基因組。本方法避開Hi?C數(shù)據(jù)組裝過程中無法組裝酶切位點數(shù)太少的contigs的缺陷,而是采用從基因組整體出發(fā)先構(gòu)建連鎖SNP群,再結(jié)合Pacbio long reads,大大降低了分型的錯誤風險。?? |
