一種基于MYSQL大數(shù)據(jù)清洗系統(tǒng)及其寫入瓶頸的方法
基本信息
申請?zhí)?/td> | CN202011050133.1 | 申請日 | - |
公開(公告)號 | CN112181965A | 公開(公告)日 | 2021-01-05 |
申請公布號 | CN112181965A | 申請公布日 | 2021-01-05 |
分類號 | G06F16/215(2019.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 任毅 | 申請(專利權(quán))人 | 成都商通數(shù)治科技有限公司 |
代理機構(gòu) | 成都玖和知識產(chǎn)權(quán)代理事務(wù)所(普通合伙) | 代理人 | 成都商通數(shù)治科技有限公司 |
地址 | 610000四川省成都市高新區(qū)劍南大道中段1537號2棟1單元15樓1506號 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于MYSQL大數(shù)據(jù)清洗系統(tǒng)及其寫入瓶頸的方法,包括:基于MYSQL的Web應(yīng)用服務(wù)器,Web應(yīng)用服務(wù)器通過DispatcherServlet分配為多個一級分布式Kafka數(shù)據(jù)分片,多個所述一級分布式Kafka數(shù)據(jù)分片內(nèi)分配多個分頁清洗Job,多個所述分頁清洗Job內(nèi)有進(jìn)行批量更新與插入的二級分布式Kafka數(shù)據(jù)分片;其中,DispatcherServlet內(nèi)有將分散在各個Kafka中的相同數(shù)據(jù)切割的AOP,將一級分布式Kafka數(shù)據(jù)分片的數(shù)據(jù)橫向切割到獨立的Kafka數(shù)據(jù)分片中;個分頁清洗Job對一級分布式Kafka數(shù)據(jù)進(jìn)行批量更新與插入清洗,根據(jù)清洗數(shù)據(jù)的大小分配至分頁清洗Job的二級分布式Kafka數(shù)據(jù)分片中?;贛YSQL的Web應(yīng)用服務(wù)器以分級的形式進(jìn)行分級優(yōu)化,并且每個階級同步進(jìn)行獨立對清洗數(shù)據(jù)、數(shù)據(jù)插入的方式進(jìn)行瓶頸優(yōu)化,快速的進(jìn)行完成優(yōu)化。?? |
