一種擴充類別式數(shù)據(jù)快速標注方法

基本信息

申請?zhí)?/td> CN201910626205.3 申請日 -
公開(公告)號 CN110334772A 公開(公告)日 2019-10-15
申請公布號 CN110334772A 申請公布日 2019-10-15
分類號 G06K9/62;G06N3/04;G06N3/08 分類 計算;推算;計數(shù);
發(fā)明人 朱順意;范繼輝;瞿明軍;李廣立;劉雪健;周莉;鞏志遠;陳建學;杜來民;鄧國超;白玥寅;張松;周雨晨 申請(專利權)人 山東領能電子科技有限公司
代理機構(gòu) 濟南金迪知識產(chǎn)權代理有限公司 代理人 山東領能電子科技有限公司;山東大學;太原理工大學
地址 250101 山東省濟南市歷下區(qū)新濼大街1166號奧盛大廈3號樓15層1505房間
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種擴充類別式數(shù)據(jù)快速標注方法,包括以下步驟:(1)獲取帶有統(tǒng)一標注A的初始數(shù)據(jù)集;(2)結(jié)合已有數(shù)據(jù)集,將A進一步分為a、b、c等多個子類;(3)選取初始數(shù)據(jù)集的一部分作為樣本,通過人工修改標注文件,快捷地將標注從A重命名為a、b、c等,得到標注樣本;(4)基于標注樣本,利用神經(jīng)網(wǎng)絡訓練模型,將所得模型對初始數(shù)據(jù)集中剩余的數(shù)據(jù)進行預標注,得到預標注數(shù)據(jù);(5)對預標注數(shù)據(jù)進行人工微調(diào),保證所涉及數(shù)據(jù)標簽全部準確,基于初始數(shù)據(jù)與微調(diào)數(shù)據(jù)對模型訓練優(yōu)化,基于更多標注樣本訓練更優(yōu)模型,最終準確地標注全部數(shù)據(jù),提高標注效率;本發(fā)明能滿足快速、準確地標注的需求,更好地服務于實際應用。