高通量測序序列的存儲方法和查詢方法

基本信息

申請?zhí)?/td> CN201710549780.9 申請日 -
公開(公告)號 CN107506618A 公開(公告)日 2017-12-22
申請公布號 CN107506618A 申請公布日 2017-12-22
分類號 G06F19/22(2011.01)I;G06F17/30(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 趙屹;卜德超;周恒 申請(專利權(quán))人 北京中科晶云科技有限公司
代理機(jī)構(gòu) 北京泛華偉業(yè)知識產(chǎn)權(quán)代理有限公司 代理人 王勇
地址 100086 北京市海淀區(qū)知春路甲48號盈都大廈C座4單元3A
法律狀態(tài) -

摘要

摘要 本發(fā)明提供一種高通量測序序列的存儲方法和查詢方法。該存儲方法包括:獲取與參考基因比對后的高通量測序序列,其中,該高通量測序序列包括每條測序序列及其起始位置、結(jié)束位置以及與參考基因的比對結(jié)果;基于預(yù)定的分層分片策略確定所述測序序列的分片索引編號,其中,所述分層分片策略包括層數(shù)、每層包含的分片數(shù)、每個(gè)分片包含的數(shù)據(jù)量、以及每層的第一個(gè)分片的索引編號;基于所確定的分片索引編號分布式存儲測序序列。本發(fā)明還提供了一種對應(yīng)于存儲方法的查詢方法。根據(jù)本發(fā)明的存儲和查詢方法能夠增加高通量測序序列的存儲和查詢的效率,并且可以進(jìn)一步直觀快速的顯示查詢的測序序列。