一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法

基本信息

申請?zhí)?/td> CN201810120373.0 申請日 -
公開(公告)號 CN108287913A 公開(公告)日 2018-07-17
申請公布號 CN108287913A 申請公布日 2018-07-17
分類號 G06F17/30;G06Q40/02 分類 計算;推算;計數(shù);
發(fā)明人 郭安 申請(專利權)人 霍爾果斯智融未來信息科技有限公司
代理機構 北京華識知識產(chǎn)權代理有限公司 代理人 李浩
地址 835000 新疆維吾爾自治區(qū)伊犁哈薩克自治州霍爾果斯經(jīng)濟開發(fā)區(qū)兵團分區(qū)開元路1號創(chuàng)新創(chuàng)業(yè)園孵化樓B-413-19室
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種數(shù)據(jù)可回溯的大規(guī)模離散型特征挖掘的方法,線上請求和線下調(diào)研使用相同的特征計算lib,線上特征計算使用的原始數(shù)據(jù)快照通過緩存進行全量保存,保障線下調(diào)研使用的數(shù)據(jù)和當時線上使用的數(shù)據(jù)一致,當特征挖掘有新的想法,需要從之前的數(shù)據(jù)中挖掘新的特征,只需更新特征計算lib,按照大規(guī)模離散型特征挖掘架構,利用更多的數(shù)據(jù)樣本制作模型。本發(fā)明可以保障在線、離線特征挖掘使用數(shù)據(jù)的一致性,模型生產(chǎn)不依賴于線上特征,離線調(diào)研完成即可上線,模型生產(chǎn)效率高,離線數(shù)據(jù)同步機制統(tǒng)一,開發(fā)維護成本低。