一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法
基本信息
申請?zhí)?/td> | CN201810120373.0 | 申請日 | - |
公開(公告)號 | CN108287913A | 公開(公告)日 | 2018-07-17 |
申請公布號 | CN108287913A | 申請公布日 | 2018-07-17 |
分類號 | G06F17/30;G06Q40/02 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 郭安 | 申請(專利權)人 | 霍爾果斯智融未來信息科技有限公司 |
代理機構 | 北京華識知識產(chǎn)權代理有限公司 | 代理人 | 李浩 |
地址 | 835000 新疆維吾爾自治區(qū)伊犁哈薩克自治州霍爾果斯經(jīng)濟開發(fā)區(qū)兵團分區(qū)開元路1號創(chuàng)新創(chuàng)業(yè)園孵化樓B-413-19室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法,線上請求和線下調(diào)研使用相同的特征計算lib,線上特征計算使用的原始數(shù)據(jù)快照通過緩存進行全量保存,保障線下調(diào)研使用的數(shù)據(jù)和當時線上使用的數(shù)據(jù)一致,當特征挖掘有新的想法,需要從之前的數(shù)據(jù)中挖掘新的特征,只需更新特征計算lib,按照大規(guī)模離散型特征挖掘架構,利用更多的數(shù)據(jù)樣本制作模型。本發(fā)明可以保障在線、離線特征挖掘使用數(shù)據(jù)的一致性,模型生產(chǎn)不依賴于線上特征,離線調(diào)研完成即可上線,模型生產(chǎn)效率高,離線數(shù)據(jù)同步機制統(tǒng)一,開發(fā)維護成本低。 |
