二代測序短序列快速比對(duì)分析方法及裝置

基本信息

申請?zhí)?/td> CN201610609337.1 申請日 -
公開(公告)號(hào) CN106295250A 公開(公告)日 2017-01-04
申請公布號(hào) CN106295250A 申請公布日 2017-01-04
分類號(hào) G06F19/22(2011.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 鄭洪坤;郭強(qiáng);許德德;馬威鋒;孫喬慧 申請(專利權(quán))人 北京普康瑞仁醫(yī)學(xué)檢驗(yàn)所有限公司
代理機(jī)構(gòu) 北京路浩知識(shí)產(chǎn)權(quán)代理有限公司 代理人 李相雨
地址 101300 北京市順義區(qū)南法信鎮(zhèn)順平路南法信段9號(hào)院1幢8層801室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開一種二代測序短序列快速比對(duì)分析方法及裝置,能夠解決測序數(shù)據(jù)的比對(duì)效率低以及內(nèi)存占用高的問題。所述方法包括:獲取測序得到的DNA短序列,并采用第一hash算法和第二hash算法分別映射編碼所述DNA短序列,分別得到第一索引和第二索引;基于預(yù)設(shè)的index查詢庫、所述第一索引和第二索引將所述DNA短序列和參考基因組進(jìn)行比對(duì),所述index查詢庫由單元結(jié)構(gòu)體數(shù)組構(gòu)成,每個(gè)單元結(jié)構(gòu)體包含有value值和index2值,存儲(chǔ)每個(gè)所述單元結(jié)構(gòu)體的數(shù)組索引偏移量為對(duì)應(yīng)的index1,即為結(jié)構(gòu)體數(shù)組對(duì)應(yīng)的索引值,K為片段序列長度;根據(jù)比對(duì)的結(jié)果,若比對(duì)上,則獲取與對(duì)應(yīng)的DNA短序列比對(duì)上的K?mer片段的value值,確定出對(duì)應(yīng)的DNA短序列所在染色體號(hào)和所在染色體上的位點(diǎn)。