一種啟發(fā)式自引入技術(shù)債務(wù)數(shù)據(jù)標(biāo)注及訓(xùn)練方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN202111654306.5 申請日 -
公開(公告)號 CN114612211A 公開(公告)日 2022-06-10
申請公布號 CN114612211A 申請公布日 2022-06-10
分類號 G06Q40/02(2012.01)I;G06F16/953(2019.01)I;G06F16/906(2019.01)I;G06N20/00(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 曲豫賓;李芳 申請(專利權(quán))人 江蘇派陶網(wǎng)絡(luò)科技有限公司
代理機(jī)構(gòu) 南通國鑫智匯知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 -
地址 226000江蘇省南通市崇川區(qū)觀音山街道人民中路255號財智天地園8幢
法律狀態(tài) -

摘要

摘要 本申請公開了一種啟發(fā)式自引入技術(shù)債務(wù)數(shù)據(jù)標(biāo)注及訓(xùn)練方法和系統(tǒng),通過基于注釋信息,選擇一個開源軟件項目的注釋信息進(jìn)行標(biāo)注得到代碼注釋關(guān)鍵詞、構(gòu)建訓(xùn)練數(shù)據(jù)集,并通過訓(xùn)練數(shù)據(jù)集對預(yù)訓(xùn)練模型進(jìn)行訓(xùn)練及微調(diào),獲得分類模型;利用分類模型對所述待標(biāo)注軟件項目的代碼注釋進(jìn)行分類預(yù)測,當(dāng)預(yù)測分類結(jié)果為有引入技術(shù)債務(wù)時,獲得模糊分類結(jié)果,判斷兩個分類結(jié)果是否匹配,當(dāng)匹配成功時,將待標(biāo)注軟件項目的代碼注釋標(biāo)注為有引入技術(shù)債務(wù)存入訓(xùn)練數(shù)據(jù)集持續(xù)對分類模型訓(xùn)練,不斷迭代完成所有數(shù)據(jù)集的標(biāo)注。解決現(xiàn)有代碼標(biāo)注為純?nèi)斯みM(jìn)行,存在費(fèi)時費(fèi)力且影響模型訓(xùn)練效率的技術(shù)問題。達(dá)到自動標(biāo)注,大幅提高標(biāo)注及模型訓(xùn)練效率的技術(shù)效果。