高通量測序數據的處理方法、處理裝置、存儲介質及處理器

基本信息

申請?zhí)?/td> CN201711296903.9 申請日 -
公開(公告)號 CN108280325A 公開(公告)日 2018-07-13
申請公布號 CN108280325A 申請公布日 2018-07-13
分類號 G06F19/22 分類 計算;推算;計數;
發(fā)明人 李暉;陳釗;莫敏俐;丁鳳;王淑娟 申請(專利權)人 北京雅康博生物科技有限公司
代理機構 北京康信知識產權代理有限責任公司 代理人 北京雅康博生物科技有限公司
地址 100094 北京市海淀區(qū)北清路103號3號樓303室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種高通量測序數據的處理方法、處理裝置、存儲介質及處理器。該處理方法包括獲取二級測序序列,二級測序序列為高通量測序數據中能夠被目的片段擴增引物識別,且去除對應的擴增引物后的測序序列;比對二級測序序列與參考基因組序列,獲得初級變異結果;以及利用已知突變數據中的突變數據修正初級變異結果,得到處理結果。通過根據已知的引物信息從高通量測序得到的原始數據中將每條序列中的引物部分去除,減少了擴增產物交疊區(qū)域內存在引物突變而造成的假陽性處理結果。還可以將高通量測序數據中一些錯誤擴增的序列去除,既提高后續(xù)分析的準確性,又有助于降低整體數據量提高分析效率。