一種優(yōu)化自動化圖片數(shù)據(jù)清洗質(zhì)量的方法、裝置和系統(tǒng)

基本信息

申請?zhí)?/td> CN201910267802.1 申請日 -
公開(公告)號 CN110083728B 公開(公告)日 2021-08-20
申請公布號 CN110083728B 申請公布日 2021-08-20
分類號 G06F16/55;G06K9/62 分類 計算;推算;計數(shù);
發(fā)明人 吳英平 申請(專利權(quán))人 上海錸鍶信息技術(shù)有限公司
代理機(jī)構(gòu) 南京思拓知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 苗建
地址 201615 上海市松江區(qū)九亭鎮(zhèn)中心路1158號21幢1001室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種優(yōu)化自動化圖片數(shù)據(jù)清洗質(zhì)量的方法、裝置和系統(tǒng),包括:順次將待清洗圖片集輸入至粗粒度二分類器和細(xì)粒度二分類器,獲得待清洗圖片數(shù)據(jù)的類別預(yù)測的置信度;基于設(shè)定的置信度閾值以及與置信度閾值相對應(yīng)的第一圖片數(shù)量閾值,篩選出需要進(jìn)行人工清洗的圖片;基于所有待人工清洗圖片的類別預(yù)測的置信度與人工清洗的反饋結(jié)果,獲得細(xì)粒度二分類器的模型準(zhǔn)確度;將細(xì)粒度二分類器的模型準(zhǔn)確度和模型優(yōu)化次數(shù)閾值作為優(yōu)化條件,進(jìn)行細(xì)粒度二分類器的模型優(yōu)化。本發(fā)明可以在原有數(shù)據(jù)清洗方法的基礎(chǔ)上經(jīng)過少量的細(xì)粒度二分類器模型迭代獲得非常高的圖像清洗質(zhì)量,在某些情況下甚至能在模型迭代完成后完全替代人工清洗。