一種基于Pacbiosubreads和Hi-Creads的全基因組分型方法

基本信息

申請(qǐng)?zhí)?/td> CN202010441252.3 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN111816248A 公開(kāi)(公告)日 2020-10-23
申請(qǐng)公布號(hào) CN111816248A 申請(qǐng)公布日 2020-10-23
分類號(hào) G16B20/00(2019.01)I 分類 物理
發(fā)明人 盧銳 申請(qǐng)(專利權(quán))人 武漢菲沙基因信息有限公司
代理機(jī)構(gòu) 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 代理人 武漢菲沙基因信息有限公司
地址 430000湖北省武漢市東湖高新技術(shù)開(kāi)發(fā)區(qū)高新大道666號(hào)武漢國(guó)家生物產(chǎn)業(yè)基地項(xiàng)目B、C、D區(qū)研發(fā)樓B1棟
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基于Pacbio subreads和Hi?C reads的全基因組分型方法,包括以下步驟:1)準(zhǔn)備參考基因組;2)將二代測(cè)序數(shù)據(jù)比對(duì)到參考基因組,檢測(cè)出各染色體的所有SNP位點(diǎn);3)將Hi?C建庫(kù)測(cè)序數(shù)據(jù)比對(duì)到參考基因組,結(jié)合SNP位點(diǎn),采用HapCUT2構(gòu)建連鎖SNP群;4)基于MVP Block對(duì)Pacbio subreads進(jìn)行分組,然后再分別組裝,最終獲取到每條染色單體序列;5)對(duì)親本基因組進(jìn)行全基因組測(cè)序,將測(cè)序結(jié)果比對(duì)到上步分出的染色單體序列上,按照比對(duì)結(jié)果將染色單體分為兩組,對(duì)應(yīng)父母本基因組。本方法避開(kāi)Hi?C數(shù)據(jù)組裝過(guò)程中無(wú)法組裝酶切位點(diǎn)數(shù)太少的contigs的缺陷,而是采用從基因組整體出發(fā)先構(gòu)建連鎖SNP群,再結(jié)合Pacbio long reads,大大降低了分型的錯(cuò)誤風(fēng)險(xiǎn)。??