基因組序列中潛在BGC的預(yù)測(cè)方法、裝置、設(shè)備及介質(zhì)

基本信息

申請(qǐng)?zhí)?/td> CN202110888145.X 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN113764034A 公開(kāi)(公告)日 2021-12-07
申請(qǐng)公布號(hào) CN113764034A 申請(qǐng)公布日 2021-12-07
分類(lèi)號(hào) G16B15/00(2019.01)I;G16B15/30(2019.01)I;G16B30/10(2019.01)I;G16B40/00(2019.01)I 分類(lèi) 物理
發(fā)明人 楊子翊;廖奔犇;張勝譽(yù);辛志偉;梁恒宇 申請(qǐng)(專(zhuān)利權(quán))人 河南省健康元生物醫(yī)藥研究院有限公司
代理機(jī)構(gòu) 北京三高永信知識(shí)產(chǎn)權(quán)代理有限責(zé)任公司 代理人 張所明
地址 518057廣東省深圳市南山區(qū)高新區(qū)科技中一路騰訊大廈35層
法律狀態(tài) -

摘要

摘要 本申請(qǐng)公開(kāi)了一種基因組序列中潛在BGC的預(yù)測(cè)方法、裝置、設(shè)備及介質(zhì),涉及人工智能領(lǐng)域。方法包括:對(duì)基因組序列中的各個(gè)基因進(jìn)行結(jié)構(gòu)域預(yù)測(cè),得到各個(gè)基因中包含的Pfam結(jié)構(gòu)域;確定各個(gè)Pfam結(jié)構(gòu)域的Pfam得分,Pfam得分用于表征Pfam結(jié)構(gòu)域?qū)儆贐GC的概率;基于各個(gè)Pfam結(jié)構(gòu)域的Pfam得分,確定基因組序列中的候選BGC;對(duì)候選BGC進(jìn)行BGC類(lèi)別預(yù)測(cè),并基于類(lèi)別預(yù)測(cè)結(jié)果確定候選BGC中的潛在BGC。本申請(qǐng)實(shí)施例采用雙重串行預(yù)測(cè)機(jī)制,先根據(jù)Pfam得分實(shí)現(xiàn)BGC的一級(jí)過(guò)濾,然后在一級(jí)過(guò)濾結(jié)果的基礎(chǔ)上通過(guò)類(lèi)別預(yù)測(cè)實(shí)現(xiàn)BGC的二級(jí)過(guò)濾,有助于降低BGC預(yù)測(cè)結(jié)果的假陽(yáng)率。