一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法
基本信息
申請?zhí)?/td> | CN201610452113.4 | 申請日 | - |
公開(公告)號 | CN106126972B | 公開(公告)日 | 2018-10-02 |
申請公布號 | CN106126972B | 申請公布日 | 2018-10-02 |
分類號 | G06F19/18;G06F19/24 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 馮收;付平;石金龍;鄭文斌;徐明珠;魯健捷;賈現(xiàn)召;周穎 | 申請(專利權(quán))人 | 哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司 |
代理機(jī)構(gòu) | 哈爾濱市松花江專利商標(biāo)事務(wù)所 | 代理人 | 哈爾濱工業(yè)大學(xué);哈爾濱工業(yè)大學(xué)國家大學(xué)科技園發(fā)展有限公司 |
地址 | 150001 黑龍江省哈爾濱市南崗區(qū)西大直街92號 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法,涉及生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域,尤其涉及一種用于蛋白質(zhì)功能預(yù)測的層級多標(biāo)簽分類方法。本發(fā)明要為解決現(xiàn)有分類方法用于預(yù)測蛋白質(zhì)功能時(shí),存在數(shù)據(jù)集不平衡問題、多標(biāo)簽問題和層級約束問題。本發(fā)明所述方法按以下步驟進(jìn)行:一、訓(xùn)練階段:在訓(xùn)練階段針對類標(biāo)簽層級結(jié)構(gòu)中的每個(gè)節(jié)點(diǎn)的數(shù)據(jù)集采用一個(gè)SVM分類器進(jìn)行訓(xùn)練,得到一組基礎(chǔ)分類器;二、預(yù)測階段:在預(yù)測階段首先使用訓(xùn)練階段獲得的這組基礎(chǔ)分類器得出未知樣本的初步結(jié)果,而后采用帶權(quán)重的TPR算法對結(jié)果進(jìn)行處理,得到滿足層級約束條件的最終結(jié)果,實(shí)現(xiàn)對蛋白質(zhì)功能的預(yù)測。本發(fā)明應(yīng)用于生物信息學(xué)及數(shù)據(jù)挖掘領(lǐng)域。 |
