一種病原微生物參考知識(shí)庫(kù)的最大多樣性聚類(lèi)構(gòu)建方法
基本信息
申請(qǐng)?zhí)?/td> | CN202110331409.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN112800245B | 公開(kāi)(公告)日 | 2021-07-16 |
申請(qǐng)公布號(hào) | CN112800245B | 申請(qǐng)公布日 | 2021-07-16 |
分類(lèi)號(hào) | G06F16/36;G06F16/35;G16B30/10;G16B30/20;G06N5/02 | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 李瑞琳;蓋偉 | 申請(qǐng)(專利權(quán))人 | 微巖醫(yī)學(xué)科技(北京)有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 王歡 |
地址 | 100176 北京市大興區(qū)濟(jì)技術(shù)開(kāi)發(fā)區(qū)經(jīng)海四路156號(hào)院11號(hào)樓2層A區(qū)001室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及生物技術(shù)領(lǐng)域,具有涉及一種病原微生物參考知識(shí)庫(kù)的最大多樣性聚類(lèi)構(gòu)建方法。該構(gòu)建采用貪心縮放算法,通過(guò)特定方法計(jì)算冗余基因組的多序列相似性,去除擴(kuò)展相似度高的序列,可以保證在去除大量冗余信息的同時(shí),最大程度保留微生物基因組的多樣性。實(shí)驗(yàn)表明,本發(fā)明提供的病原微生物知識(shí)庫(kù)的最大多樣性聚類(lèi)方法準(zhǔn)確性高、檢測(cè)效率高且數(shù)據(jù)冗余率低,尤其適用于大規(guī)模的病原微生物全基因組序列。 |
