人類短片段串聯(lián)重復(fù)序列高通量測序信息的處理方法
基本信息
申請?zhí)?/td> | CN201610102496.2 | 申請日 | - |
公開(公告)號 | CN107122625A | 公開(公告)日 | 2017-09-01 |
申請公布號 | CN107122625A | 申請公布日 | 2017-09-01 |
分類號 | G06F19/20(2011.01)I;G06F19/22(2011.01)I;G06F19/24(2011.01)I;G06F19/26(2011.01)I;G06F19/28(2011.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 周騁;姚旭斌;潘雅姣 | 申請(專利權(quán))人 | 北京愛普益生物科技有限公司 |
代理機(jī)構(gòu) | 北京三高永信知識產(chǎn)權(quán)代理有限責(zé)任公司 | 代理人 | 北京愛普益生物科技有限公司 |
地址 | 100176 北京市大興區(qū)經(jīng)濟(jì)技術(shù)開發(fā)區(qū)地盛東路1號愛普益大廈5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了人類短片段串聯(lián)重復(fù)序列高通量測序信息的處理方法,屬于生物檢測領(lǐng)域。該方法為:保留單張芯片的STR高通量測序信息中具有預(yù)設(shè)測序長度的序列,形成第一序列;根據(jù)樣本標(biāo)簽信息,將第一序列分類至不同樣本文件夾中,根據(jù)STR目的片段特異引物信息,將第一序列再分類至不同STR基因座文件夾中,形成第二序列;建立針對不同STR基因座的階梯參比序列,將第二序列與其中相應(yīng)STR基因座的序列比對,保留序列相似度≥90%的第三序列;將樣本測序條目數(shù)的閾值設(shè)為1000,將基因座測序條目數(shù)的閾值設(shè)為50,將基因座內(nèi)分型測序條目數(shù)的閾值設(shè)為5,將基因座內(nèi)分型測序條目數(shù)/基因座測序條目數(shù)的閾值設(shè)為40%,篩選第三序列中≥以上閾值的序列,得STR分型結(jié)果。 |
