一種訓練樣本的選取方法、系統(tǒng)、存儲介質(zhì)和電子設備
基本信息
申請?zhí)?/td> | CN202111017696.5 | 申請日 | - |
公開(公告)號 | CN113469290A | 公開(公告)日 | 2021-10-01 |
申請公布號 | CN113469290A | 申請公布日 | 2021-10-01 |
分類號 | G06K9/62(2006.01)I;G06N3/08(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 王少將;唐會軍;劉拴林;梁堃;陳建 | 申請(專利權)人 | 北京數(shù)美時代科技有限公司 |
代理機構 | 北京輕創(chuàng)知識產(chǎn)權代理有限公司 | 代理人 | 翟磊 |
地址 | 100012北京市朝陽區(qū)來廣營西路5號院誠盈中心3號樓14層1401-1404單元 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明涉及一種訓練樣本的選取方法、系統(tǒng)、存儲介質(zhì)和電子設備,將任一數(shù)據(jù)樣本輸入現(xiàn)有的已訓練好的數(shù)據(jù)模型中,根據(jù)輸出結果計算該數(shù)據(jù)樣本的信息熵,并進行進行歸一化,直至得到多個數(shù)據(jù)樣本的歸一化后的信息熵并按照從大到小順序排列,前個歸一化后的信息熵對應的數(shù)據(jù)樣本均作為訓練樣本,也就是挑選出能夠?qū)δP陀柧毱鸬降妮^大效果的數(shù)據(jù)樣本作為訓練樣本,然后再進行新模型的訓練,既保證新訓練出的模型的精度,還能降低標注成本。 |
