基因組斷裂點(diǎn)識別方法及應(yīng)用

基本信息

申請?zhí)?/td> CN202010084468.9 申請日 -
公開(公告)號 CN111292803A 公開(公告)日 2020-06-16
申請公布號 CN111292803A 申請公布日 2020-06-16
分類號 G16B20/30(2019.01)I;G16B50/00(2019.01)I 分類 -
發(fā)明人 劉晶星;嚴(yán)慧;陳白雪;孫明明;趙薇薇;于世輝 申請(專利權(quán))人 廣州市金域轉(zhuǎn)化醫(yī)學(xué)研究院有限公司
代理機(jī)構(gòu) 廣州新諾專利商標(biāo)事務(wù)所有限公司 代理人 廣州金域醫(yī)學(xué)檢驗(yàn)集團(tuán)股份有限公司;廣州市金域轉(zhuǎn)化醫(yī)學(xué)研究院有限公司
地址 510000廣東省廣州市國際生物島螺旋三路10號
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種基因組斷裂點(diǎn)識別方法及應(yīng)用,屬于生物信息學(xué)分析技術(shù)領(lǐng)域。該分析識別方法包括以下步驟:數(shù)據(jù)比對:獲取樣本測序下機(jī)數(shù)據(jù),將樣本reads與參考基因組進(jìn)行對比;構(gòu)建邊緣坐標(biāo)集合:匯總所有reads比對到參考基因組上的起始坐標(biāo)和終止坐標(biāo),所述read分割點(diǎn)在參考基因組比對坐標(biāo)軸上的位置即為read邊緣坐標(biāo);識別斷裂點(diǎn):篩選reads邊緣坐標(biāo)集中的位點(diǎn),當(dāng)該位點(diǎn)覆蓋超過閾值,且該處產(chǎn)生了分割點(diǎn)的reads占總reads比例大于預(yù)設(shè)比例時(shí),則判斷為斷裂點(diǎn);判定斷裂點(diǎn):將斷裂點(diǎn)在預(yù)設(shè)數(shù)據(jù)庫中進(jìn)行出現(xiàn)頻次的查詢,當(dāng)出現(xiàn)頻次小于預(yù)設(shè)頻次時(shí),則判斷為高風(fēng)險(xiǎn)致病性結(jié)構(gòu)變異。上述基因組斷裂點(diǎn)識別方法,可以排除大量假陽性或者人群多態(tài)性的斷裂點(diǎn)。??