一種病原微生物參考知識庫的最大多樣性聚類構(gòu)建方法

基本信息

申請?zhí)?/td> CN202110331409.1 申請日 -
公開(公告)號 CN112800245B 公開(公告)日 2021-07-16
申請公布號 CN112800245B 申請公布日 2021-07-16
分類號 G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 分類 計算;推算;計數(shù);
發(fā)明人 李瑞琳;蓋偉 申請(專利權(quán))人 微巖醫(yī)學科技(北京)有限公司
代理機構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 王歡
地址 100176 北京市大興區(qū)濟技術(shù)開發(fā)區(qū)經(jīng)海四路156號院11號樓2層A區(qū)001室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及生物技術(shù)領(lǐng)域,具有涉及一種病原微生物參考知識庫的最大多樣性聚類構(gòu)建方法。該構(gòu)建采用貪心縮放算法,通過特定方法計算冗余基因組的多序列相似性,去除擴展相似度高的序列,可以保證在去除大量冗余信息的同時,最大程度保留微生物基因組的多樣性。實驗表明,本發(fā)明提供的病原微生物知識庫的最大多樣性聚類方法準確性高、檢測效率高且數(shù)據(jù)冗余率低,尤其適用于大規(guī)模的病原微生物全基因組序列。