一種病原微生物參考知識(shí)庫(kù)的最大多樣性聚類(lèi)構(gòu)建方法

基本信息

申請(qǐng)?zhí)?/td> CN202110331409.1 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN112800245B 公開(kāi)(公告)日 2021-07-16
申請(qǐng)公布號(hào) CN112800245B 申請(qǐng)公布日 2021-07-16
分類(lèi)號(hào) G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 李瑞琳;蓋偉 申請(qǐng)(專利權(quán))人 微巖醫(yī)學(xué)科技(北京)有限公司
代理機(jī)構(gòu) 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 代理人 王歡
地址 100176 北京市大興區(qū)濟(jì)技術(shù)開(kāi)發(fā)區(qū)經(jīng)海四路156號(hào)院11號(hào)樓2層A區(qū)001室
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及生物技術(shù)領(lǐng)域,具有涉及一種病原微生物參考知識(shí)庫(kù)的最大多樣性聚類(lèi)構(gòu)建方法。該構(gòu)建采用貪心縮放算法,通過(guò)特定方法計(jì)算冗余基因組的多序列相似性,去除擴(kuò)展相似度高的序列,可以保證在去除大量冗余信息的同時(shí),最大程度保留微生物基因組的多樣性。實(shí)驗(yàn)表明,本發(fā)明提供的病原微生物知識(shí)庫(kù)的最大多樣性聚類(lèi)方法準(zhǔn)確性高、檢測(cè)效率高且數(shù)據(jù)冗余率低,尤其適用于大規(guī)模的病原微生物全基因組序列。