一種基因測序數(shù)據(jù)重組封裝的方法和裝置

基本信息

申請?zhí)?/td> CN202110810347.2 申請日 -
公開(公告)號 CN113268461B 公開(公告)日 2021-09-17
申請公布號 CN113268461B 申請公布日 2021-09-17
分類號 G06F16/174(2019.01)I;G16B30/00(2019.01)I;G16B50/50(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 郭祥學(xué);張巍 申請(專利權(quán))人 廣州嘉檢醫(yī)學(xué)檢測有限公司
代理機(jī)構(gòu) 廣州君策達(dá)知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 陳宏升
地址 510000廣東省廣州市黃埔區(qū)廣州國際生物島螺旋四路9號第二層C201單元
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種基因測序數(shù)據(jù)重組封裝的方法,包括如下步驟,步驟1:構(gòu)建參考基因組數(shù)據(jù)庫和基因字典;步驟2:獲取樣品中染色體的第二基因序列;步驟3:將步驟2的第二基因序列和多條第一基因序列進(jìn)行比對;步驟4:將第二基因序列和標(biāo)準(zhǔn)基因進(jìn)行比對;步驟5:將基因片段中的核苷酸以N個為一組依次進(jìn)行分組;步驟6:將前段、基因片段、后段用基因字典中的代號表示,形成一組核苷酸數(shù)據(jù);步驟7:將不同染色體上的核苷酸數(shù)據(jù)進(jìn)行統(tǒng)計并壓縮即可得到壓縮后的基因組數(shù)據(jù);步驟8:還原得到樣品的第二基因序列。本發(fā)明將一小段核苷酸采用字典代碼化,能夠?qū)崿F(xiàn)數(shù)據(jù)的有效壓縮;同時,本發(fā)明還提供基于該方法的裝置。