二代測序短序列快速比對分析方法及裝置

基本信息

申請?zhí)?/td> CN201610609337.1 申請日 -
公開(公告)號 CN106295250B 公開(公告)日 2019-03-29
申請公布號 CN106295250B 申請公布日 2019-03-29
分類號 G16B30/10(2019.01)I 分類 物理
發(fā)明人 鄭洪坤; 郭強; 許德德; 馬威鋒; 孫喬慧 申請(專利權(quán))人 北京普康瑞仁醫(yī)學(xué)檢驗所有限公司
代理機構(gòu) 北京路浩知識產(chǎn)權(quán)代理有限公司 代理人 李相雨
地址 101300 北京市順義區(qū)南法信鎮(zhèn)順平路南法信段9號院1幢8層801室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種二代測序短序列快速比對分析方法及裝置,能夠解決測序數(shù)據(jù)的比對效率低以及內(nèi)存占用高的問題。所述方法包括:獲取測序得到的DNA短序列,并采用第一hash算法和第二hash算法分別映射編碼所述DNA短序列,分別得到第一索引和第二索引;基于預(yù)設(shè)的index查詢庫、所述第一索引和第二索引將所述DNA短序列和參考基因組進行比對,所述index查詢庫由單元結(jié)構(gòu)體數(shù)組構(gòu)成,每個單元結(jié)構(gòu)體包含有value值和index2值,存儲每個所述單元結(jié)構(gòu)體的數(shù)組索引偏移量為對應(yīng)的index1,即為結(jié)構(gòu)體數(shù)組對應(yīng)的索引值,K為片段序列長度;根據(jù)比對的結(jié)果,若比對上,則獲取與對應(yīng)的DNA短序列比對上的K?mer片段的value值,確定出對應(yīng)的DNA短序列所在染色體號和所在染色體上的位點。