海量數(shù)據(jù)的清洗方法及裝置

基本信息

申請(qǐng)?zhí)?/td> CN201910572435.6 申請(qǐng)日 -
公開(kāi)(公告)號(hào) CN110334081A 公開(kāi)(公告)日 2019-10-15
申請(qǐng)公布號(hào) CN110334081A 申請(qǐng)公布日 2019-10-15
分類(lèi)號(hào) G06F16/21;G06F16/215 分類(lèi) 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 張鵬程;柳超 申請(qǐng)(專(zhuān)利權(quán))人 北京天眼查科技有限公司
代理機(jī)構(gòu) 北京清亦華知識(shí)產(chǎn)權(quán)代理事務(wù)所(普通合伙) 代理人 北京天眼查科技有限公司
地址 100086 北京市海淀區(qū)知春路65號(hào)院1號(hào)樓B座19層1901
法律狀態(tài) -

摘要

摘要 本發(fā)明提出一種海量數(shù)據(jù)的清洗方法及裝置,其中方法應(yīng)用于消息消費(fèi)者,包括:向預(yù)設(shè)的中間件發(fā)送消息獲取請(qǐng)求;中間件用于從數(shù)據(jù)中心批量獲取待清洗消息,并進(jìn)行存儲(chǔ);接收中間件返回的待清洗消息;對(duì)待清洗消息進(jìn)行清洗處理,得到清洗后消息;根據(jù)清洗后消息的標(biāo)識(shí),將清洗后消息存儲(chǔ)至對(duì)應(yīng)的數(shù)據(jù)庫(kù)中,從而能夠從數(shù)據(jù)中心批量拉取待清洗消息,縮短總的拉取時(shí)間,且拉取和清洗可以并行處理,從而縮短清洗時(shí)間,提高清洗效率,確保數(shù)據(jù)中心的數(shù)據(jù)無(wú)法得到及時(shí)清洗。進(jìn)而提供數(shù)據(jù)時(shí),提供清洗后數(shù)據(jù),提高用戶體驗(yàn)。