大數(shù)據(jù)缺失值填充方法、裝置和計算機(jī)程序

基本信息

申請?zhí)?/td> CN202010499997.5 申請日 -
公開(公告)號 CN111737463A 公開(公告)日 2020-10-02
申請公布號 CN111737463A 申請公布日 2020-10-02
分類號 G06F16/35(2019.01)I;G06F40/30(2020.01)I 分類 -
發(fā)明人 王宏志;秦謙;姜濤 申請(專利權(quán))人 江蘇名通信息科技有限公司
代理機(jī)構(gòu) 南京縱橫知識產(chǎn)權(quán)代理有限公司 代理人 江蘇名通信息科技有限公司
地址 212004江蘇省鎮(zhèn)江市京口區(qū)學(xué)府路118號京口高創(chuàng)中心6樓
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了大數(shù)據(jù)缺失值填充方法、裝置和計算機(jī)程序,對數(shù)據(jù)集中的缺失值按照語義進(jìn)行區(qū)分,確定所有存在性缺失值;確定所有存在性缺失值的數(shù)值類型;對各待填充數(shù)值類型分別采用不同的方法進(jìn)行缺失值填充。本發(fā)明對于數(shù)據(jù)中的缺失值按照語義分為三種,重點關(guān)注存在型缺失值,通過各用戶提供各自的答案,從得到的答案可以分為一些是相似或相同的。本發(fā)明方法簡單,復(fù)雜度大大降低,并且通過各用戶提供答案可降低開銷同時能提高填充準(zhǔn)確度,實現(xiàn)面向大數(shù)據(jù)的缺失值填充,考慮到對大數(shù)據(jù)的適應(yīng)性,本發(fā)明提供的計算機(jī)程序可以完成三種類型數(shù)據(jù)的一輪計算,提升了填充效率。??