一種基于Pacbiosubreads和Hi-Creads的全基因組分型方法
基本信息
申請(qǐng)?zhí)?/td> | CN202010441252.3 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN111816248A | 公開(kāi)(公告)日 | 2020-10-23 |
申請(qǐng)公布號(hào) | CN111816248A | 申請(qǐng)公布日 | 2020-10-23 |
分類號(hào) | G16B20/00(2019.01)I | 分類 | 物理 |
發(fā)明人 | 盧銳 | 申請(qǐng)(專利權(quán))人 | 武漢菲沙基因信息有限公司 |
代理機(jī)構(gòu) | 上海精晟知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 武漢菲沙基因信息有限公司 |
地址 | 430000湖北省武漢市東湖高新技術(shù)開(kāi)發(fā)區(qū)高新大道666號(hào)武漢國(guó)家生物產(chǎn)業(yè)基地項(xiàng)目B、C、D區(qū)研發(fā)樓B1棟 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種基于Pacbio subreads和Hi?C reads的全基因組分型方法,包括以下步驟:1)準(zhǔn)備參考基因組;2)將二代測(cè)序數(shù)據(jù)比對(duì)到參考基因組,檢測(cè)出各染色體的所有SNP位點(diǎn);3)將Hi?C建庫(kù)測(cè)序數(shù)據(jù)比對(duì)到參考基因組,結(jié)合SNP位點(diǎn),采用HapCUT2構(gòu)建連鎖SNP群;4)基于MVP Block對(duì)Pacbio subreads進(jìn)行分組,然后再分別組裝,最終獲取到每條染色單體序列;5)對(duì)親本基因組進(jìn)行全基因組測(cè)序,將測(cè)序結(jié)果比對(duì)到上步分出的染色單體序列上,按照比對(duì)結(jié)果將染色單體分為兩組,對(duì)應(yīng)父母本基因組。本方法避開(kāi)Hi?C數(shù)據(jù)組裝過(guò)程中無(wú)法組裝酶切位點(diǎn)數(shù)太少的contigs的缺陷,而是采用從基因組整體出發(fā)先構(gòu)建連鎖SNP群,再結(jié)合Pacbio long reads,大大降低了分型的錯(cuò)誤風(fēng)險(xiǎn)。?? |
