一種房屋信息采集服務(wù)系統(tǒng)
基本信息
申請?zhí)?/td> | CN201410545328.1 | 申請日 | - |
公開(公告)號(hào) | CN104317857B | 公開(公告)日 | 2019-03-22 |
申請公布號(hào) | CN104317857B | 申請公布日 | 2019-03-22 |
分類號(hào) | G06F16/951(2019.01)I; G06F16/955(2019.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 賈巖 | 申請(專利權(quán))人 | 深圳市易圖資訊股份有限公司 |
代理機(jī)構(gòu) | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 | 代理人 | 深圳市易圖資訊股份有限公司 |
地址 | 518000 廣東省深圳市福田區(qū)香林路36號(hào)九潤大廈2至5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種房屋信息采集服務(wù)系統(tǒng),包括:網(wǎng)站爬蟲組件,用于針對一個(gè)網(wǎng)站的抓取工作,針對網(wǎng)站的頁面元素與特點(diǎn)進(jìn)行專門的解析,完成數(shù)據(jù)抽取后,映射到對應(yīng)的數(shù)據(jù)實(shí)體當(dāng)中,再交給網(wǎng)站爬蟲服務(wù)模塊進(jìn)行數(shù)據(jù)的保存;監(jiān)控服務(wù)模塊,用于監(jiān)控網(wǎng)站爬蟲服務(wù)模塊的工作情況,及各個(gè)網(wǎng)站爬蟲組件的工作情況,及時(shí)發(fā)現(xiàn)網(wǎng)站爬蟲組件是否工作正常,抓取的數(shù)據(jù)是否正確;管理服務(wù)模塊,用于整個(gè)網(wǎng)站爬蟲服務(wù)的管理與配置;部署服務(wù)模塊,用于升級(jí)了網(wǎng)站爬蟲組件后部署升級(jí)網(wǎng)站爬蟲組件;調(diào)度服務(wù)模塊,用于調(diào)度網(wǎng)站爬蟲服務(wù)里面的網(wǎng)站爬蟲組件如何工作、什么時(shí)候工作、什么時(shí)候停止。以解決對抓取目標(biāo)的描述或定義、對網(wǎng)頁或數(shù)據(jù)的分析與過濾、對URL的搜索策略的問題。 |
