人類短片段串聯(lián)重復(fù)序列高通量測序信息的處理方法

基本信息

申請?zhí)?/td> CN201610102496.2 申請日 -
公開(公告)號 CN107122625A 公開(公告)日 2017-09-01
申請公布號 CN107122625A 申請公布日 2017-09-01
分類號 G06F19/20(2011.01)I;G06F19/22(2011.01)I;G06F19/24(2011.01)I;G06F19/26(2011.01)I;G06F19/28(2011.01)I 分類 計算;推算;計數(shù);
發(fā)明人 周騁;姚旭斌;潘雅姣 申請(專利權(quán))人 北京愛普益生物科技有限公司
代理機(jī)構(gòu) 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 代理人 北京愛普益生物科技有限公司
地址 100176 北京市大興區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)地盛東路1號愛普益大廈5層
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了人類短片段串聯(lián)重復(fù)序列高通量測序信息的處理方法,屬于生物檢測領(lǐng)域。該方法為:保留單張芯片的STR高通量測序信息中具有預(yù)設(shè)測序長度的序列,形成第一序列;根據(jù)樣本標(biāo)簽信息,將第一序列分類至不同樣本文件夾中,根據(jù)STR目的片段特異引物信息,將第一序列再分類至不同STR基因座文件夾中,形成第二序列;建立針對不同STR基因座的階梯參比序列,將第二序列與其中相應(yīng)STR基因座的序列比對,保留序列相似度≥90%的第三序列;將樣本測序條目數(shù)的閾值設(shè)為1000,將基因座測序條目數(shù)的閾值設(shè)為50,將基因座內(nèi)分型測序條目數(shù)的閾值設(shè)為5,將基因座內(nèi)分型測序條目數(shù)/基因座測序條目數(shù)的閾值設(shè)為40%,篩選第三序列中≥以上閾值的序列,得STR分型結(jié)果。