一種基因測序數(shù)據(jù)重組封裝的方法和裝置
基本信息
申請?zhí)?/td> | CN202110810347.2 | 申請日 | - |
公開(公告)號 | CN113268461B | 公開(公告)日 | 2021-09-17 |
申請公布號 | CN113268461B | 申請公布日 | 2021-09-17 |
分類號 | G06F16/174(2019.01)I;G16B30/00(2019.01)I;G16B50/50(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 郭祥學(xué);張巍 | 申請(專利權(quán))人 | 廣州嘉檢醫(yī)學(xué)檢測有限公司 |
代理機(jī)構(gòu) | 廣州君策達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 陳宏升 |
地址 | 510000廣東省廣州市黃埔區(qū)廣州國際生物島螺旋四路9號第二層C201單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基因測序數(shù)據(jù)重組封裝的方法,包括如下步驟,步驟1:構(gòu)建參考基因組數(shù)據(jù)庫和基因字典;步驟2:獲取樣品中染色體的第二基因序列;步驟3:將步驟2的第二基因序列和多條第一基因序列進(jìn)行比對;步驟4:將第二基因序列和標(biāo)準(zhǔn)基因進(jìn)行比對;步驟5:將基因片段中的核苷酸以N個為一組依次進(jìn)行分組;步驟6:將前段、基因片段、后段用基因字典中的代號表示,形成一組核苷酸數(shù)據(jù);步驟7:將不同染色體上的核苷酸數(shù)據(jù)進(jìn)行統(tǒng)計并壓縮即可得到壓縮后的基因組數(shù)據(jù);步驟8:還原得到樣品的第二基因序列。本發(fā)明將一小段核苷酸采用字典代碼化,能夠?qū)崿F(xiàn)數(shù)據(jù)的有效壓縮;同時,本發(fā)明還提供基于該方法的裝置。 |
