一種快速獲取目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)的方法
基本信息
申請?zhí)?/td> | CN202110751896.7 | 申請日 | - |
公開(公告)號 | CN113488106A | 公開(公告)日 | 2021-10-08 |
申請公布號 | CN113488106A | 申請公布日 | 2021-10-08 |
分類號 | G16B30/10(2019.01)I;G16B50/00(2019.01)I;G06F16/22(2019.01)I | 分類 | 物理 |
發(fā)明人 | 栗海波;姜玥;梁萌萌 | 申請(專利權(quán))人 | 蘇州賽美科基因科技有限公司 |
代理機(jī)構(gòu) | 北京同輝知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉洪勛 |
地址 | 215100江蘇省蘇州市相城區(qū)高鐵新城青龍港路58號天成時代商務(wù)廣場17層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種快速獲取目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)的方法,以樣本原始測序數(shù)據(jù)為基礎(chǔ),利用公共基因組數(shù)據(jù)庫,分別獲得參考基因組序列文件與所有基因的坐標(biāo)信息文件,并構(gòu)建參考基因組索引文件與染色體索引文件;構(gòu)建樣本原始測序數(shù)據(jù)的序列行號與基因組比對坐標(biāo)的映射關(guān)系,運(yùn)用映射關(guān)系,快速重構(gòu)出目標(biāo)基因序列的樣本原始測序數(shù)據(jù);利用染色體索引文件和目標(biāo)基因序列的樣本原始測序數(shù)據(jù)進(jìn)行序列比對,獲得目標(biāo)基因序列原始比對數(shù)據(jù)文件,再經(jīng)過排序和去重,獲得最終的目標(biāo)基因組區(qū)域比對結(jié)果數(shù)據(jù)。這種方法具有部署簡單、操作方便、高效性、高通量、適用范圍廣的特點(diǎn)。所得結(jié)果與原始二級數(shù)據(jù)BAM文件相比基本無信息損失。 |
