一種基于真實(shí)社會(huì)關(guān)系和大數(shù)據(jù)的網(wǎng)絡(luò)信息分析方法
基本信息
申請(qǐng)?zhí)?/td> | CN201610383969.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN106127503A | 公開(公告)日 | 2016-11-16 |
申請(qǐng)公布號(hào) | CN106127503A | 申請(qǐng)公布日 | 2016-11-16 |
分類號(hào) | G06Q30/02(2012.01)I;G06Q50/00(2012.01)I | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 呂永強(qiáng);雷名輝;尼瑪扎西;袁建;汪劉艷;鐘軍;徐國公;陳富基 | 申請(qǐng)(專利權(quán))人 | 廣州市邦富軟件有限公司 |
代理機(jī)構(gòu) | - | 代理人 | - |
地址 | 510663 廣東省廣州市天河區(qū)天河軟件園高唐新建區(qū)廣州互聯(lián)網(wǎng)產(chǎn)業(yè)園1號(hào)樓第五層A501至A510房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于真實(shí)社會(huì)關(guān)系和大數(shù)據(jù)的網(wǎng)絡(luò)信息分析方法包括以下步驟:(1)重點(diǎn)客戶網(wǎng)絡(luò)交互信息的抓取,利用既有部署的蜘蛛群集,在每個(gè)蜘蛛節(jié)點(diǎn)同時(shí)運(yùn)行多個(gè)采集線程,采集基于靜態(tài)IP方式或動(dòng)態(tài)IP方式,不定期訪問目標(biāo)網(wǎng)站通過時(shí)間戳,校對(duì)信息的更新情況;(2)分析交互信息,系統(tǒng)通過分布式采集集群在互聯(lián)網(wǎng)上通過爬蟲抓取的方式采集重點(diǎn)交互信息數(shù)據(jù),經(jīng)過對(duì)單條交互數(shù)據(jù)加工、清洗、挖掘、分類、自動(dòng)文摘、語義庫管理等工作完成數(shù)據(jù)預(yù)處理,并通過對(duì)單條交互信息分析、上下文場景分析、真實(shí)社會(huì)關(guān)系與網(wǎng)絡(luò)社會(huì)關(guān)系對(duì)比分析等,將分析結(jié)果數(shù)據(jù)導(dǎo)入社會(huì)關(guān)系信息庫中。 |
