一種汽車車型網(wǎng)絡(luò)價格監(jiān)測系統(tǒng)
基本信息
申請?zhí)?/td> | CN202010750740.2 | 申請日 | - |
公開(公告)號 | CN111814023B | 公開(公告)日 | 2021-06-15 |
申請公布號 | CN111814023B | 申請公布日 | 2021-06-15 |
分類號 | G06F16/951(2019.01)I;G06F16/27(2019.01)I;G06F16/25(2019.01)I;G06F16/248(2019.01)I;G06F16/22(2019.01)I;G06F16/182(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孫一帥;李奏換;龔鶴皋;陳楚豪;郭建錚;梁維新 | 申請(專利權(quán))人 | 廣州威爾森信息科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識產(chǎn)權(quán)代理有限公司 | 代理人 | 黃忠 |
地址 | 510623廣東省廣州市天河區(qū)珠江東路12號1201房之全層(僅限辦公用途) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請公開了一種汽車車型網(wǎng)絡(luò)價格監(jiān)測系統(tǒng),數(shù)據(jù)采集模塊通過爬蟲技術(shù)從汽車網(wǎng)站采集汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)并存儲至預(yù)置數(shù)據(jù)庫;數(shù)據(jù)同步模塊將預(yù)置數(shù)據(jù)庫的網(wǎng)絡(luò)價格數(shù)據(jù)同步到Hadoop大數(shù)據(jù)平臺的分布式文件系統(tǒng)HDFS;數(shù)據(jù)預(yù)處理模塊將HDFS的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)加載到Hive表,對Hive表中的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)依次進(jìn)行異常值過濾、重復(fù)值過濾、車型型號匹配和匯總,得到預(yù)處理后的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù);數(shù)據(jù)計(jì)算模塊根據(jù)預(yù)置計(jì)算規(guī)則對預(yù)處理后的汽車車型網(wǎng)絡(luò)價格數(shù)據(jù)進(jìn)行計(jì)算;可視化模塊對計(jì)算結(jié)果進(jìn)行可視化,解決了現(xiàn)有的汽車車型價格的獲取和處理采用人工處理,存在數(shù)據(jù)采集和處理時間長,處理效率低的技術(shù)問題。 |
