用于增廣數(shù)據(jù)的數(shù)據(jù)清洗方法、裝置和設備

基本信息

申請?zhí)?/td> CN201910204109.X 申請日 -
公開(公告)號 CN109947756A 公開(公告)日 2019-06-28
申請公布號 CN109947756A 申請公布日 2019-06-28
分類號 G06F16/215(2019.01)I; G06F16/50(2019.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王畢才 申請(專利權)人 中技數(shù)字科技(成都)有限責任公司
代理機構 北京萬思博知識產(chǎn)權代理有限公司 代理人 冀婷
地址 610094 四川省成都市高新區(qū)世紀城路198號附1497號
法律狀態(tài) -

摘要

摘要 本申請公開了一種用于增廣數(shù)據(jù)的數(shù)據(jù)清洗方法、裝置和設備。其中,方法包括:對原始圖像集進行數(shù)據(jù)增廣,得到樣本圖像集;計算所述樣本圖像集中的每一個圖像的圖像指紋;對于每一個圖像,將該圖像的圖像指紋與所述樣本圖像集中其他圖像的圖像指紋進行相似度比較,在相似度大于或等于第一閾值的情況下,將該圖像從所述樣本圖像集中移除。該方法能夠?qū)νㄟ^增廣方式得到的數(shù)據(jù)進行清洗,清除相似度高的圖像,從而降低耦合度,采用該方法得到的數(shù)據(jù)集對模型進行訓練,不但能夠滿足模型對數(shù)據(jù)量的要求,也能夠提高模型精度。