一種流式數(shù)據(jù)處理方法和系統(tǒng)

基本信息

申請?zhí)?/td> CN201810889376.0 申請日 -
公開(公告)號 CN109213793A 公開(公告)日 2019-01-15
申請公布號 CN109213793A 申請公布日 2019-01-15
分類號 G06F16/2455;G06F16/2458 分類 計算;推算;計數(shù);
發(fā)明人 左梅蘭;郭子森 申請(專利權)人 涇縣麥藍網(wǎng)絡技術服務有限公司
代理機構 北京國昊天誠知識產(chǎn)權代理有限公司 代理人 施敬勃
地址 242530 安徽省宣城市涇縣涇川鎮(zhèn)晏公社區(qū)慶豐組075號
法律狀態(tài) -

摘要

摘要 本發(fā)明公開了一種流式數(shù)據(jù)處理方法和系統(tǒng),通過將電子商務中大量流式數(shù)據(jù)抽取流式數(shù)據(jù)的概要特征數(shù)據(jù),建立多條處理線程,經(jīng)合概要特征數(shù)據(jù)并成多個數(shù)據(jù)集,并且對數(shù)據(jù)預先進行預處理,降低數(shù)據(jù)維度,合理計算參考數(shù)據(jù)與其他數(shù)據(jù)之間的數(shù)據(jù)相似度值,從而確定數(shù)據(jù)集中的每個數(shù)據(jù)是否具有較好的關聯(lián)度,最終確定是否保留該數(shù)據(jù)??梢允沟迷诿鎸α魇綌?shù)據(jù)量較大且高并發(fā)訪問時,系統(tǒng)可以及時響應請求,過濾錯誤數(shù)據(jù),詢問時間減少,傳輸性能可以得到優(yōu)化。