一種數(shù)據(jù)處理方法及系統(tǒng)、計算機設(shè)備、計算機存儲介質(zhì)
基本信息
申請?zhí)?/td> | CN202110114058.9 | 申請日 | - |
公開(公告)號 | CN112835711A | 公開(公告)日 | 2021-05-25 |
申請公布號 | CN112835711A | 申請公布日 | 2021-05-25 |
分類號 | G06F9/50;G06F9/48 | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 楊宇 | 申請(專利權(quán))人 | 北京遠(yuǎn)盟普惠健康科技有限公司 |
代理機構(gòu) | 北京辰權(quán)知識產(chǎn)權(quán)代理有限公司 | 代理人 | 劉廣達(dá) |
地址 | 100022 北京市朝陽區(qū)東三環(huán)中路20號樓26層6室 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明能夠提供一種數(shù)據(jù)處理方法及系統(tǒng)、計算機設(shè)備、計算機存儲介質(zhì)。該數(shù)據(jù)處理方法可包括:基于接收的任務(wù)發(fā)起指令生成數(shù)據(jù)處理任務(wù),讀取數(shù)據(jù)處理任務(wù)指向的待處理數(shù)據(jù)所在的文件路徑信息,根據(jù)文件路徑信息將數(shù)據(jù)處理任務(wù)分解為多個子任務(wù),創(chuàng)建用于處理所述子任務(wù)的集群子角色,為各個集群子角色分別分配至少一個子任務(wù),利用各個集群子角色分別處理各自接收到的至少一個子任務(wù),以對待處理數(shù)據(jù)進行采集和解析。本發(fā)明通過并行分布式數(shù)據(jù)采集手段能夠快速地對大量的數(shù)據(jù)進行處理,數(shù)據(jù)采集和分析效率極高,基于易構(gòu)建和擴展集群的優(yōu)勢能夠較好地滿足快速增長的數(shù)據(jù)的及時處理需求,明顯降低了數(shù)據(jù)采集和分析難度。 |
