一種基于Pacbiosubreads和Hi-Creads的全基因組分型方法

基本信息

申請?zhí)?/td> CN202010441252.3 申請日 -
公開(公告)號 CN111816248A 公開(公告)日 2020-10-23
申請公布號 CN111816248A 申請公布日 2020-10-23
分類號 G16B20/00(2019.01)I 分類 物理
發(fā)明人 盧銳 申請(專利權(quán))人 武漢菲沙基因信息有限公司
代理機構(gòu) 上海精晟知識產(chǎn)權(quán)代理有限公司 代理人 武漢菲沙基因信息有限公司
地址 430000湖北省武漢市東湖高新技術(shù)開發(fā)區(qū)高新大道666號武漢國家生物產(chǎn)業(yè)基地項目B、C、D區(qū)研發(fā)樓B1棟
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于Pacbio subreads和Hi?C reads的全基因組分型方法,包括以下步驟:1)準備參考基因組;2)將二代測序數(shù)據(jù)比對到參考基因組,檢測出各染色體的所有SNP位點;3)將Hi?C建庫測序數(shù)據(jù)比對到參考基因組,結(jié)合SNP位點,采用HapCUT2構(gòu)建連鎖SNP群;4)基于MVP Block對Pacbio subreads進行分組,然后再分別組裝,最終獲取到每條染色單體序列;5)對親本基因組進行全基因組測序,將測序結(jié)果比對到上步分出的染色單體序列上,按照比對結(jié)果將染色單體分為兩組,對應(yīng)父母本基因組。本方法避開Hi?C數(shù)據(jù)組裝過程中無法組裝酶切位點數(shù)太少的contigs的缺陷,而是采用從基因組整體出發(fā)先構(gòu)建連鎖SNP群,再結(jié)合Pacbio long reads,大大降低了分型的錯誤風險。??