一種房屋信息采集服務(wù)系統(tǒng)
基本信息
申請(qǐng)?zhí)?/td> | CN201410545328.1 | 申請(qǐng)日 | - |
公開(kāi)(公告)號(hào) | CN104317857B | 公開(kāi)(公告)日 | 2019-03-22 |
申請(qǐng)公布號(hào) | CN104317857B | 申請(qǐng)公布日 | 2019-03-22 |
分類(lèi)號(hào) | G06F16/951(2019.01)I; G06F16/955(2019.01)I | 分類(lèi) | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 賈巖 | 申請(qǐng)(專(zhuān)利權(quán))人 | 深圳市易圖資訊股份有限公司 |
代理機(jī)構(gòu) | 深圳市世紀(jì)恒程知識(shí)產(chǎn)權(quán)代理事務(wù)所 | 代理人 | 深圳市易圖資訊股份有限公司 |
地址 | 518000 廣東省深圳市福田區(qū)香林路36號(hào)九潤(rùn)大廈2至5層 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開(kāi)了一種房屋信息采集服務(wù)系統(tǒng),包括:網(wǎng)站爬蟲(chóng)組件,用于針對(duì)一個(gè)網(wǎng)站的抓取工作,針對(duì)網(wǎng)站的頁(yè)面元素與特點(diǎn)進(jìn)行專(zhuān)門(mén)的解析,完成數(shù)據(jù)抽取后,映射到對(duì)應(yīng)的數(shù)據(jù)實(shí)體當(dāng)中,再交給網(wǎng)站爬蟲(chóng)服務(wù)模塊進(jìn)行數(shù)據(jù)的保存;監(jiān)控服務(wù)模塊,用于監(jiān)控網(wǎng)站爬蟲(chóng)服務(wù)模塊的工作情況,及各個(gè)網(wǎng)站爬蟲(chóng)組件的工作情況,及時(shí)發(fā)現(xiàn)網(wǎng)站爬蟲(chóng)組件是否工作正常,抓取的數(shù)據(jù)是否正確;管理服務(wù)模塊,用于整個(gè)網(wǎng)站爬蟲(chóng)服務(wù)的管理與配置;部署服務(wù)模塊,用于升級(jí)了網(wǎng)站爬蟲(chóng)組件后部署升級(jí)網(wǎng)站爬蟲(chóng)組件;調(diào)度服務(wù)模塊,用于調(diào)度網(wǎng)站爬蟲(chóng)服務(wù)里面的網(wǎng)站爬蟲(chóng)組件如何工作、什么時(shí)候工作、什么時(shí)候停止。以解決對(duì)抓取目標(biāo)的描述或定義、對(duì)網(wǎng)頁(yè)或數(shù)據(jù)的分析與過(guò)濾、對(duì)URL的搜索策略的問(wèn)題。 |
