一種訓練樣本的選取方法、系統(tǒng)、存儲介質(zhì)和電子設備

基本信息

申請?zhí)?/td> CN202111017696.5 申請日 -
公開(公告)號 CN113469290A 公開(公告)日 2021-10-01
申請公布號 CN113469290A 申請公布日 2021-10-01
分類號 G06K9/62(2006.01)I;G06N3/08(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 王少將;唐會軍;劉拴林;梁堃;陳建 申請(專利權)人 北京數(shù)美時代科技有限公司
代理機構 北京輕創(chuàng)知識產(chǎn)權代理有限公司 代理人 翟磊
地址 100012北京市朝陽區(qū)來廣營西路5號院誠盈中心3號樓14層1401-1404單元
法律狀態(tài) -

摘要

摘要 本發(fā)明涉及一種訓練樣本的選取方法、系統(tǒng)、存儲介質(zhì)和電子設備,將任一數(shù)據(jù)樣本輸入現(xiàn)有的已訓練好的數(shù)據(jù)模型中,根據(jù)輸出結果計算該數(shù)據(jù)樣本的信息熵,并進行進行歸一化,直至得到多個數(shù)據(jù)樣本的歸一化后的信息熵并按照從大到小順序排列,前個歸一化后的信息熵對應的數(shù)據(jù)樣本均作為訓練樣本,也就是挑選出能夠?qū)δP陀柧毱鸬降妮^大效果的數(shù)據(jù)樣本作為訓練樣本,然后再進行新模型的訓練,既保證新訓練出的模型的精度,還能降低標注成本。