高通量測(cè)序序列的存儲(chǔ)方法和查詢(xún)方法
基本信息
申請(qǐng)?zhí)?/td> | CN201710549780.9 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN107506618B | 公開(kāi)(公告)日 | 2017-12-22 |
申請(qǐng)公布號(hào) | CN107506618B | 申請(qǐng)公布日 | 2017-12-22 |
分類(lèi)號(hào) | G16B50/30(2019.01)I | 分類(lèi) | 物理 |
發(fā)明人 | 趙屹;卜德超;周恒 | 申請(qǐng)(專(zhuān)利權(quán))人 | 北京中科晶云科技有限公司 |
代理機(jī)構(gòu) | 北京泛華偉業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王勇 |
地址 | 100086北京市海淀區(qū)知春路甲48號(hào)盈都大廈C座4單元3A | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供一種高通量測(cè)序序列的存儲(chǔ)方法和查詢(xún)方法。該存儲(chǔ)方法包括:獲取與參考基因比對(duì)后的高通量測(cè)序序列,其中,該高通量測(cè)序序列包括每條測(cè)序序列及其起始位置、結(jié)束位置以及與參考基因的比對(duì)結(jié)果;基于預(yù)定的分層分片策略確定所述測(cè)序序列的分片索引編號(hào),其中,所述分層分片策略包括層數(shù)、每層包含的分片數(shù)、每個(gè)分片包含的數(shù)據(jù)量、以及每層的第一個(gè)分片的索引編號(hào);基于所確定的分片索引編號(hào)分布式存儲(chǔ)測(cè)序序列。本發(fā)明還提供了一種對(duì)應(yīng)于存儲(chǔ)方法的查詢(xún)方法。根據(jù)本發(fā)明的存儲(chǔ)和查詢(xún)方法能夠增加高通量測(cè)序序列的存儲(chǔ)和查詢(xún)的效率,并且可以進(jìn)一步直觀快速的顯示查詢(xún)的測(cè)序序列。?? |
