一種用于解讀二代測(cè)序結(jié)果所需數(shù)據(jù)的提取方法
基本信息
申請(qǐng)?zhí)?/td> | CN202111200370.6 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN113643761B | 公開(公告)日 | 2022-01-18 |
申請(qǐng)公布號(hào) | CN113643761B | 申請(qǐng)公布日 | 2022-01-18 |
分類號(hào) | G16B50/30(2019.01)I;G16B50/10(2019.01)I;G16B25/00(2019.01)I;G06F16/22(2019.01)I | 分類 | 物理 |
發(fā)明人 | 謝欣;余偉師;梁萌萌;付宏旭;李鵬飛 | 申請(qǐng)(專利權(quán))人 | 蘇州賽美科基因科技有限公司 |
代理機(jī)構(gòu) | 北京同輝知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 劉洪勛 |
地址 | 215000 江蘇省蘇州市工業(yè)園區(qū)星湖街218號(hào)5幢生物納米園A4-309、310、311室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種用于解讀二代測(cè)序結(jié)果所需數(shù)據(jù)的提取方法,屬于數(shù)據(jù)處理的技術(shù)領(lǐng)域,包括以下步驟:S1:將映射版本標(biāo)簽置于TSV文件的首行,并發(fā)送到推送系統(tǒng)并入列式數(shù)據(jù)庫(kù)保存;S2:生成元數(shù)據(jù)來(lái)記錄BAM文件的相關(guān)信息,使其能夠與對(duì)應(yīng)的TSV文件的注釋信息進(jìn)行匹配,并發(fā)送到推送系統(tǒng)并入關(guān)系型行式數(shù)據(jù)庫(kù)保存;S3:錄入受檢者臨床表型信息,并發(fā)送到推送系統(tǒng)并入關(guān)系型行式數(shù)據(jù)庫(kù)保存;其中,步驟S1、S2和S3同步完成。本發(fā)明能夠克服現(xiàn)有技術(shù)在提取解讀二代測(cè)序結(jié)果所需要的三項(xiàng)數(shù)據(jù)時(shí)存在的難以應(yīng)對(duì)TSV文件表頭行變化、提取BAM文件需要人工介入和缺少主索引關(guān)聯(lián)同一受檢者的缺陷。 |
