一種快速獲取目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)的方法

基本信息

申請?zhí)?/td> CN202110751896.7 申請日 -
公開(公告)號 CN113488106A 公開(公告)日 2021-10-08
申請公布號 CN113488106A 申請公布日 2021-10-08
分類號 G16B30/10(2019.01)I;G16B50/00(2019.01)I;G06F16/22(2019.01)I 分類 物理
發(fā)明人 栗海波;姜玥;梁萌萌 申請(專利權(quán))人 蘇州賽美科基因科技有限公司
代理機(jī)構(gòu) 北京同輝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 劉洪勛
地址 215100江蘇省蘇州市相城區(qū)高鐵新城青龍港路58號天成時代商務(wù)廣場17層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種快速獲取目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)的方法,以樣本原始測序數(shù)據(jù)為基礎(chǔ),利用公共基因組數(shù)據(jù)庫,分別獲得參考基因組序列文件與所有基因的坐標(biāo)信息文件,并構(gòu)建參考基因組索引文件與染色體索引文件;構(gòu)建樣本原始測序數(shù)據(jù)的序列行號與基因組比對坐標(biāo)的映射關(guān)系,運(yùn)用映射關(guān)系,快速重構(gòu)出目標(biāo)基因序列的樣本原始測序數(shù)據(jù);利用染色體索引文件和目標(biāo)基因序列的樣本原始測序數(shù)據(jù)進(jìn)行序列比對,獲得目標(biāo)基因序列原始比對數(shù)據(jù)文件,再經(jīng)過排序和去重,獲得最終的目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)。這種方法具有部署簡單、操作方便、高效性、高通量、適用范圍廣的特點(diǎn)。所得結(jié)果與原始二級數(shù)據(jù)BAM文件相比基本無信息損失。