一種隱藏尋址的DNA存儲編碼設(shè)計方法

基本信息

申請?zhí)?/td> CN202210373179.X 申請日 -
公開(公告)號 CN114678074A 公開(公告)日 2022-06-28
申請公布號 CN114678074A 申請公布日 2022-06-28
分類號 G16B50/30(2019.01)I 分類 物理
發(fā)明人 王賓;王鵬浩;陳蓉蓉;張強 申請(專利權(quán))人 大連大學(xué)
代理機(jī)構(gòu) 大連智高專利事務(wù)所(特殊普通合伙) 代理人 -
地址 116622遼寧省大連市經(jīng)濟(jì)技術(shù)開發(fā)區(qū)學(xué)府大街10號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種隱藏尋址的DNA存儲編碼設(shè)計方法,包括:首先要將信息轉(zhuǎn)換為二進(jìn)制數(shù)據(jù),并將數(shù)據(jù)分組、組內(nèi)分段。其次,在每組數(shù)據(jù)中通過噴泉編碼方式將數(shù)據(jù)異或并轉(zhuǎn)化為DNA序列。然后,將每組數(shù)據(jù)中滿足約束條件的DNA片段保留。最后,從每組數(shù)據(jù)中選出能夠代表此序列的索引片段及7個配合索引解碼的DNA片段,依次連接并輸出。本發(fā)明因為在組內(nèi)的數(shù)據(jù)片段異或,轉(zhuǎn)化為滿足約束條件的DNA片段使得DNA序列的局部GC含量更穩(wěn)定,提高了序列的測序正確性。同時選取的用于隱藏索引的DNA片段為數(shù)據(jù)異或產(chǎn)生,所以相似性較低,可以避免序列拼接過程中因為索引相似度過高導(dǎo)致的拼接錯誤。