基于難樣本的訓(xùn)練方法、裝置及電子設(shè)備

基本信息

申請?zhí)?/td> CN201810675642.X 申請日 -
公開(公告)號 CN108960314B 公開(公告)日 2022-02-11
申請公布號 CN108960314B 申請公布日 2022-02-11
分類號 G06K9/62(2006.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 朱星宇;黃鼎;張誠 申請(專利權(quán))人 杭州曠云金智科技有限公司
代理機(jī)構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 王術(shù)蘭
地址 100096 北京市海淀區(qū)西三旗建材城內(nèi)建中路12幢一層1268號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于難樣本的訓(xùn)練方法、裝置及電子設(shè)備,該方法首先利用預(yù)訓(xùn)練模型對公開數(shù)據(jù)集中的樣本進(jìn)行遍歷識別,獲得被誤識別為目標(biāo)類的負(fù)類樣本,將該負(fù)類樣本添加至包括正類樣本的第一數(shù)據(jù)集中,形成第二數(shù)據(jù)集;然后基于該第二數(shù)據(jù)集,利用預(yù)選代價(jià)函數(shù)和預(yù)先設(shè)定的難樣本針對性代價(jià)函數(shù)對初始模型進(jìn)行訓(xùn)練,得到輸出模型。該方式將從公開數(shù)據(jù)集中挑選出的負(fù)類樣本,加入后續(xù)用于訓(xùn)練的數(shù)據(jù)集中,然后利用預(yù)先設(shè)定的難樣本針對性代價(jià)函數(shù),基于該包含負(fù)類樣本的數(shù)據(jù)集進(jìn)行模型訓(xùn)練,從而加強(qiáng)對易識別為FP的難樣本的識別學(xué)習(xí),在不增加模型輸出類別的情況下,有效抑制FP的同時(shí),提升模型的識別準(zhǔn)確率,改善用戶的使用體驗(yàn)。