高通量測序數(shù)據(jù)的處理方法、處理裝置、存儲介質(zhì)及處理器

基本信息

申請?zhí)?/td> CN201711296903.9 申請日 -
公開(公告)號 CN108280325A 公開(公告)日 2018-07-13
申請公布號 CN108280325A 申請公布日 2018-07-13
分類號 G06F19/22 分類 計算;推算;計數(shù);
發(fā)明人 李暉;陳釗;莫敏俐;丁鳳;王淑娟 申請(專利權(quán))人 北京雅康博生物科技有限公司
代理機構(gòu) 北京康信知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 北京雅康博生物科技有限公司
地址 100094 北京市海淀區(qū)北清路103號3號樓303室
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種高通量測序數(shù)據(jù)的處理方法、處理裝置、存儲介質(zhì)及處理器。該處理方法包括獲取二級測序序列,二級測序序列為高通量測序數(shù)據(jù)中能夠被目的片段擴增引物識別,且去除對應(yīng)的擴增引物后的測序序列;比對二級測序序列與參考基因組序列,獲得初級變異結(jié)果;以及利用已知突變數(shù)據(jù)中的突變數(shù)據(jù)修正初級變異結(jié)果,得到處理結(jié)果。通過根據(jù)已知的引物信息從高通量測序得到的原始數(shù)據(jù)中將每條序列中的引物部分去除,減少了擴增產(chǎn)物交疊區(qū)域內(nèi)存在引物突變而造成的假陽性處理結(jié)果。還可以將高通量測序數(shù)據(jù)中一些錯誤擴增的序列去除,既提高后續(xù)分析的準(zhǔn)確性,又有助于降低整體數(shù)據(jù)量提高分析效率。