高通量測(cè)序序列的存儲(chǔ)方法和查詢(xún)方法

基本信息

申請(qǐng)?zhí)?/td> CN201710549780.9 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN107506618B 公開(kāi)(公告)日 2017-12-22
申請(qǐng)公布號(hào) CN107506618B 申請(qǐng)公布日 2017-12-22
分類(lèi)號(hào) G16B50/30(2019.01)I 分類(lèi) 物理
發(fā)明人 趙屹;卜德超;周恒 申請(qǐng)(專(zhuān)利權(quán))人 北京中科晶云科技有限公司
代理機(jī)構(gòu) 北京泛華偉業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王勇
地址 100086北京市海淀區(qū)知春路甲48號(hào)盈都大廈C座4單元3A
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種高通量測(cè)序序列的存儲(chǔ)方法和查詢(xún)方法。該存儲(chǔ)方法包括:獲取與參考基因比對(duì)后的高通量測(cè)序序列,其中,該高通量測(cè)序序列包括每條測(cè)序序列及其起始位置、結(jié)束位置以及與參考基因的比對(duì)結(jié)果;基于預(yù)定的分層分片策略確定所述測(cè)序序列的分片索引編號(hào),其中,所述分層分片策略包括層數(shù)、每層包含的分片數(shù)、每個(gè)分片包含的數(shù)據(jù)量、以及每層的第一個(gè)分片的索引編號(hào);基于所確定的分片索引編號(hào)分布式存儲(chǔ)測(cè)序序列。本發(fā)明還提供了一種對(duì)應(yīng)于存儲(chǔ)方法的查詢(xún)方法。根據(jù)本發(fā)明的存儲(chǔ)和查詢(xún)方法能夠增加高通量測(cè)序序列的存儲(chǔ)和查詢(xún)的效率,并且可以進(jìn)一步直觀快速的顯示查詢(xún)的測(cè)序序列。??