一種病原微生物參考知識庫的最大多樣性聚類構建方法

基本信息

申請?zhí)?/td> CN202110331409.1 申請日 -
公開(公告)號 CN112800245B 公開(公告)日 2021-07-16
申請公布號 CN112800245B 申請公布日 2021-07-16
分類號 G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 分類 計算;推算;計數;
發(fā)明人 李瑞琳;蓋偉 申請(專利權)人 杭州蕭山微巖醫(yī)學檢驗實驗室有限公司
代理機構 北京集佳知識產權代理有限公司 代理人 王歡
地址 100176 北京市大興區(qū)濟技術開發(fā)區(qū)經海四路156號院11號樓2層A區(qū)001室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及生物技術領域,具有涉及一種病原微生物參考知識庫的最大多樣性聚類構建方法。該構建采用貪心縮放算法,通過特定方法計算冗余基因組的多序列相似性,去除擴展相似度高的序列,可以保證在去除大量冗余信息的同時,最大程度保留微生物基因組的多樣性。實驗表明,本發(fā)明提供的病原微生物知識庫的最大多樣性聚類方法準確性高、檢測效率高且數據冗余率低,尤其適用于大規(guī)模的病原微生物全基因組序列。