一種汽車車型網(wǎng)絡(luò)價(jià)格監(jiān)測(cè)系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN202010750740.2 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN111814023A | 公開(公告)日 | 2021-06-15 |
申請(qǐng)公布號(hào) | CN111814023A | 申請(qǐng)公布日 | 2021-06-15 |
分類號(hào) | G06F16/951;G06F16/27;G06F16/25;G06F16/248;G06F16/22;G06F16/182 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 孫一帥;李奏換;龔鶴皋;陳楚豪;郭建錚;梁維新 | 申請(qǐng)(專利權(quán))人 | 廣州威爾森信息科技有限公司 |
代理機(jī)構(gòu) | 北京集佳知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 黃忠 |
地址 | 510623 廣東省廣州市天河區(qū)珠江東路12號(hào)1201房之全層(僅限辦公用途) | ||
法律狀態(tài) | - |
摘要
摘要 | 本申請(qǐng)公開了一種汽車車型網(wǎng)絡(luò)價(jià)格監(jiān)測(cè)系統(tǒng),數(shù)據(jù)采集模塊通過爬蟲技術(shù)從汽車網(wǎng)站采集汽車車型網(wǎng)絡(luò)價(jià)格數(shù)據(jù)并存儲(chǔ)至預(yù)置數(shù)據(jù)庫;數(shù)據(jù)同步模塊將預(yù)置數(shù)據(jù)庫的網(wǎng)絡(luò)價(jià)格數(shù)據(jù)同步到Hadoop大數(shù)據(jù)平臺(tái)的分布式文件系統(tǒng)HDFS;數(shù)據(jù)預(yù)處理模塊將HDFS的汽車車型網(wǎng)絡(luò)價(jià)格數(shù)據(jù)加載到Hive表,對(duì)Hive表中的汽車車型網(wǎng)絡(luò)價(jià)格數(shù)據(jù)依次進(jìn)行異常值過濾、重復(fù)值過濾、車型型號(hào)匹配和匯總,得到預(yù)處理后的汽車車型網(wǎng)絡(luò)價(jià)格數(shù)據(jù);數(shù)據(jù)計(jì)算模塊根據(jù)預(yù)置計(jì)算規(guī)則對(duì)預(yù)處理后的汽車車型網(wǎng)絡(luò)價(jià)格數(shù)據(jù)進(jìn)行計(jì)算;可視化模塊對(duì)計(jì)算結(jié)果進(jìn)行可視化,解決了現(xiàn)有的汽車車型價(jià)格的獲取和處理采用人工處理,存在數(shù)據(jù)采集和處理時(shí)間長(zhǎng),處理效率低的技術(shù)問題。 |
