一種面向基因組檢測(cè)數(shù)據(jù)傳輸和預(yù)處理的處理方法及系統(tǒng)

基本信息

申請(qǐng)?zhí)?/td> CN201510663214.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN106603591A 公開(kāi)(公告)日 2017-04-26
申請(qǐng)公布號(hào) CN106603591A 申請(qǐng)公布日 2017-04-26
分類號(hào) H04L29/08(2006.01)I 分類 電通信技術(shù);
發(fā)明人 王振飛 申請(qǐng)(專利權(quán))人 北京聚道科技有限公司
代理機(jī)構(gòu) 北京律誠(chéng)同業(yè)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 北京聚道科技有限公司
地址 100098 北京市海淀區(qū)花園東路11號(hào)泰興大廈501室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及基因組測(cè)序數(shù)據(jù)傳輸、分析與檢測(cè)領(lǐng)域,特別涉及一種面向基因組檢測(cè)數(shù)據(jù)傳輸和預(yù)處理的處理方法及系統(tǒng),該方法包括:獲取所述基因組檢測(cè)數(shù)據(jù),將所述基因組檢測(cè)數(shù)據(jù)進(jìn)行分塊,其中若所述基因組檢測(cè)數(shù)據(jù)為單鏈數(shù)據(jù),則M個(gè)Read短序列的所述基因組檢測(cè)數(shù)據(jù),按照每N個(gè)Read短序列一個(gè)分塊,分為P=INT(M/N),INT()為向上取整函數(shù),P為分塊數(shù)量,若所述基因組檢測(cè)數(shù)據(jù)為雙鏈數(shù)據(jù),則鏈數(shù)據(jù)R1與鏈數(shù)據(jù)R2分別按照單鏈數(shù)據(jù)分塊方法進(jìn)行分塊,生成R1分塊數(shù)據(jù)與R2分塊數(shù)據(jù),且每個(gè)所述R1分塊數(shù)據(jù)與所述R2分塊數(shù)據(jù)的其中之一相匹配,反之亦然;將分塊數(shù)據(jù)傳輸?shù)椒?wù)器進(jìn)行基因組分析與檢測(cè)。本發(fā)明基因組數(shù)據(jù)預(yù)處理時(shí)間花費(fèi)顯著減小且增加了處理過(guò)程的容錯(cuò)性。