基于難樣本的訓練方法、裝置及電子設(shè)備

基本信息

申請?zhí)?/td> CN201810675642.X 申請日 -
公開(公告)號 CN108960314B 公開(公告)日 2022-02-11
申請公布號 CN108960314B 申請公布日 2022-02-11
分類號 G06K9/62(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 朱星宇;黃鼎;張誠 申請(專利權(quán))人 杭州曠云金智科技有限公司
代理機構(gòu) 北京超凡志成知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 王術(shù)蘭
地址 100096 北京市海淀區(qū)西三旗建材城內(nèi)建中路12幢一層1268號
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于難樣本的訓練方法、裝置及電子設(shè)備,該方法首先利用預訓練模型對公開數(shù)據(jù)集中的樣本進行遍歷識別,獲得被誤識別為目標類的負類樣本,將該負類樣本添加至包括正類樣本的第一數(shù)據(jù)集中,形成第二數(shù)據(jù)集;然后基于該第二數(shù)據(jù)集,利用預選代價函數(shù)和預先設(shè)定的難樣本針對性代價函數(shù)對初始模型進行訓練,得到輸出模型。該方式將從公開數(shù)據(jù)集中挑選出的負類樣本,加入后續(xù)用于訓練的數(shù)據(jù)集中,然后利用預先設(shè)定的難樣本針對性代價函數(shù),基于該包含負類樣本的數(shù)據(jù)集進行模型訓練,從而加強對易識別為FP的難樣本的識別學習,在不增加模型輸出類別的情況下,有效抑制FP的同時,提升模型的識別準確率,改善用戶的使用體驗。