數(shù)據(jù)標(biāo)注方法及裝置
基本信息
申請?zhí)?/td> | CN202110764998.2 | 申請日 | - |
公開(公告)號 | CN113205163A | 公開(公告)日 | 2021-08-03 |
申請公布號 | CN113205163A | 申請公布日 | 2021-08-03 |
分類號 | G06K9/62(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 鄭繼龍;齊紅威;何鴻凌;肖永紅 | 申請(專利權(quán))人 | 數(shù)據(jù)堂(北京)科技股份有限公司 |
代理機構(gòu) | 北京三友知識產(chǎn)權(quán)代理有限公司 | 代理人 | 侯天印;郝博 |
地址 | 100192北京市海淀區(qū)寶盛南路1號院11號樓1層101-01 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種數(shù)據(jù)標(biāo)注方法及裝置,該方法包括:利用無監(jiān)督學(xué)習(xí)算法進行冷啟動,對原始的無標(biāo)簽數(shù)據(jù)進行初級分類,生成弱和偽標(biāo)簽數(shù)據(jù)信息;對偽標(biāo)簽數(shù)據(jù)信息進行校驗標(biāo)注;對預(yù)設(shè)數(shù)量的弱標(biāo)簽數(shù)據(jù)信息進行標(biāo)注,獲得部分已標(biāo)注數(shù)據(jù),基于弱監(jiān)督學(xué)習(xí)算法和部分已標(biāo)注數(shù)據(jù),對剩余的弱標(biāo)簽數(shù)據(jù)信息進行預(yù)標(biāo)注,生成預(yù)標(biāo)注結(jié)果;對預(yù)標(biāo)注結(jié)果進行半監(jiān)督學(xué)習(xí)算法的樣本篩選,獲得精品數(shù)據(jù)集;對精品數(shù)據(jù)集進行數(shù)據(jù)補充,獲得全標(biāo)簽數(shù)據(jù)集;利用全標(biāo)簽數(shù)據(jù)集對無監(jiān)督學(xué)習(xí)算法、弱監(jiān)督學(xué)習(xí)算法和半監(jiān)督學(xué)習(xí)算法進行算法迭代,獲得優(yōu)化的無監(jiān)督學(xué)習(xí)算法、弱監(jiān)督學(xué)習(xí)算法和半監(jiān)督學(xué)習(xí)算法。本發(fā)明可以大幅減少人工標(biāo)注成本,并提高數(shù)據(jù)標(biāo)注效率。 |
