一種啟發(fā)式自引入技術(shù)債務(wù)數(shù)據(jù)標(biāo)注及訓(xùn)練方法和系統(tǒng)
基本信息
申請?zhí)?/td> | CN202111654306.5 | 申請日 | - |
公開(公告)號 | CN114612211A | 公開(公告)日 | 2022-06-10 |
申請公布號 | CN114612211A | 申請公布日 | 2022-06-10 |
分類號 | G06Q40/02(2012.01)I;G06F16/953(2019.01)I;G06F16/906(2019.01)I;G06N20/00(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 曲豫賓;李芳 | 申請(專利權(quán))人 | 江蘇派陶網(wǎng)絡(luò)科技有限公司 |
代理機(jī)構(gòu) | 南通國鑫智匯知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | - |
地址 | 226000江蘇省南通市崇川區(qū)觀音山街道人民中路255號財智天地園8幢 | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種啟發(fā)式自引入技術(shù)債務(wù)數(shù)據(jù)標(biāo)注及訓(xùn)練方法和系統(tǒng),通過基于注釋信息,選擇一個開源軟件項目的注釋信息進(jìn)行標(biāo)注得到代碼注釋關(guān)鍵詞、構(gòu)建訓(xùn)練數(shù)據(jù)集,并通過訓(xùn)練數(shù)據(jù)集對預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練及微調(diào),獲得分類模型;利用分類模型對所述待標(biāo)注軟件項目的代碼注釋進(jìn)行分類預(yù)測,當(dāng)預(yù)測分類結(jié)果為有引入技術(shù)債務(wù)時,獲得模糊分類結(jié)果,判斷兩個分類結(jié)果是否匹配,當(dāng)匹配成功時,將待標(biāo)注軟件項目的代碼注釋標(biāo)注為有引入技術(shù)債務(wù)存入訓(xùn)練數(shù)據(jù)集持續(xù)對分類模型訓(xùn)練,不斷迭代完成所有數(shù)據(jù)集的標(biāo)注。解決現(xiàn)有代碼標(biāo)注為純?nèi)斯みM(jìn)行,存在費(fèi)時費(fèi)力且影響模型訓(xùn)練效率的技術(shù)問題。達(dá)到自動標(biāo)注,大幅提高標(biāo)注及模型訓(xùn)練效率的技術(shù)效果。 |
