大數(shù)據(jù)缺失值填充方法、裝置和計算機(jī)程序
基本信息
申請?zhí)?/td> | CN202010499997.5 | 申請日 | - |
公開(公告)號 | CN111737463A | 公開(公告)日 | 2020-10-02 |
申請公布號 | CN111737463A | 申請公布日 | 2020-10-02 |
分類號 | G06F16/35(2019.01)I;G06F40/30(2020.01)I | 分類 | - |
發(fā)明人 | 王宏志;秦謙;姜濤 | 申請(專利權(quán))人 | 江蘇名通信息科技有限公司 |
代理機(jī)構(gòu) | 南京縱橫知識產(chǎn)權(quán)代理有限公司 | 代理人 | 江蘇名通信息科技有限公司 |
地址 | 212004江蘇省鎮(zhèn)江市京口區(qū)學(xué)府路118號京口高創(chuàng)中心6樓 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了大數(shù)據(jù)缺失值填充方法、裝置和計算機(jī)程序,對數(shù)據(jù)集中的缺失值按照語義進(jìn)行區(qū)分,確定所有存在性缺失值;確定所有存在性缺失值的數(shù)值類型;對各待填充數(shù)值類型分別采用不同的方法進(jìn)行缺失值填充。本發(fā)明對于數(shù)據(jù)中的缺失值按照語義分為三種,重點關(guān)注存在型缺失值,通過各用戶提供各自的答案,從得到的答案可以分為一些是相似或相同的。本發(fā)明方法簡單,復(fù)雜度大大降低,并且通過各用戶提供答案可降低開銷同時能提高填充準(zhǔn)確度,實現(xiàn)面向大數(shù)據(jù)的缺失值填充,考慮到對大數(shù)據(jù)的適應(yīng)性,本發(fā)明提供的計算機(jī)程序可以完成三種類型數(shù)據(jù)的一輪計算,提升了填充效率。?? |
