一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法

基本信息

申請?zhí)?/td> CN201610452113.4 申請日 -
公開(公告)號 CN106126972B 公開(公告)日 2018-10-02
申請公布號 CN106126972B 申請公布日 2018-10-02
分類號 G06F19/18;G06F19/24 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 馮收;付平;石金龍;鄭文斌;徐明珠;魯健捷;賈現(xiàn)召;周穎 申請(專利權(quán))人 哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司
代理機(jī)構(gòu) 哈爾濱市松花江專利商標(biāo)事務(wù)所 代理人 哈爾濱工業(yè)大學(xué);哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司
地址 150001 黑龍江省哈爾濱市南崗區(qū)西大直街92號
法律狀態(tài) -

摘要

摘要 一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法,涉及生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法。本發(fā)明要為解決現(xiàn)有分類方法用于預(yù)測蛋白質(zhì)功能時(shí),存在數(shù)據(jù)集不平衡問題、多標(biāo)簽問題和層級約束問題。本發(fā)明所述方法按以下步驟進(jìn)行:一、訓(xùn)練階段:在訓(xùn)練階段針對類標(biāo)簽層級結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)的數(shù)據(jù)集采用一個(gè)SVM分類器進(jìn)行訓(xùn)練,得到一組基礎(chǔ)分類器;二、預(yù)測階段:在預(yù)測階段首先使用訓(xùn)練階段獲得的這組基礎(chǔ)分類器得出未知樣本的初步結(jié)果,而后采用帶權(quán)重的TPR算法對結(jié)果進(jìn)行處理,得到滿足層級約束條件的最終結(jié)果,實(shí)現(xiàn)對蛋白質(zhì)功能的預(yù)測。本發(fā)明應(yīng)用于生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域。