一種汽車車型網(wǎng)絡(luò)價格監(jiān)測系統(tǒng)

基本信息

申請?zhí)?/td> CN202010750740.2 申請日 -
公開(公告)號 CN111814023B 公開(公告)日 2021-06-15
申請公布號 CN111814023B 申請公布日 2021-06-15
分類號 G06F16/951(2019.01)I;G06F16/27(2019.01)I;G06F16/25(2019.01)I;G06F16/248(2019.01)I;G06F16/22(2019.01)I;G06F16/182(2019.01)I 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 孫一帥;李奏換;龔鶴皋;陳楚豪;郭建錚;梁維新 申請(專利權(quán))人 廣州威爾森信息科技有限公司
代理機(jī)構(gòu) 北京集佳知識產(chǎn)權(quán)代理有限公司 代理人 黃忠
地址 510623廣東省廣州市天河區(qū)珠江東路12號1201房之全層(僅限辦公用途)
法律狀態(tài) -

摘要

摘要 本申請公開了一種汽車車型網(wǎng)絡(luò)價格監(jiān)測系統(tǒng),數(shù)據(jù)采集模塊通過爬蟲技術(shù)從汽車網(wǎng)站采集汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)并存儲至預(yù)置數(shù)據(jù)庫;數(shù)據(jù)同步模塊將預(yù)置數(shù)據(jù)庫的網(wǎng)絡(luò)價格數(shù)據(jù)同步到Hadoop大數(shù)據(jù)平臺的分布式文件系統(tǒng)HDFS;數(shù)據(jù)預(yù)處理模塊將HDFS的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)加載到Hive表,對Hive表中的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)依次進(jìn)行異常值過濾、重復(fù)值過濾、車型型號匹配和匯總,得到預(yù)處理后的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù);數(shù)據(jù)計(jì)算模塊根據(jù)預(yù)置計(jì)算規(guī)則對預(yù)處理后的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)進(jìn)行計(jì)算;可視化模塊對計(jì)算結(jié)果進(jìn)行可視化,解決了現(xiàn)有的汽車車型價格的獲取和處理采用人工處理,存在數(shù)據(jù)采集和處理時間長,處理效率低的技術(shù)問題。