一種基于真實社會關(guān)系和大數(shù)據(jù)的網(wǎng)絡信息分析方法
基本信息
申請?zhí)?/td> | CN201610383969.0 | 申請日 | - |
公開(公告)號 | CN106127503A | 公開(公告)日 | 2016-11-16 |
申請公布號 | CN106127503A | 申請公布日 | 2016-11-16 |
分類號 | G06Q30/02(2012.01)I;G06Q50/00(2012.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 呂永強;雷名輝;尼瑪扎西;袁建;汪劉艷;鐘軍;徐國公;陳富基 | 申請(專利權(quán))人 | 加查壩鄉(xiāng)藏面辣子店 |
代理機構(gòu) | - | 代理人 | - |
地址 | 510663 廣東省廣州市天河區(qū)天河軟件園高唐新建區(qū)廣州互聯(lián)網(wǎng)產(chǎn)業(yè)園1號樓第五層A501至A510房 | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明公開了一種基于真實社會關(guān)系和大數(shù)據(jù)的網(wǎng)絡信息分析方法包括以下步驟:(1)重點客戶網(wǎng)絡交互信息的抓取,利用既有部署的蜘蛛群集,在每個蜘蛛節(jié)點同時運行多個采集線程,采集基于靜態(tài)IP方式或動態(tài)IP方式,不定期訪問目標網(wǎng)站通過時間戳,校對信息的更新情況;(2)分析交互信息,系統(tǒng)通過分布式采集集群在互聯(lián)網(wǎng)上通過爬蟲抓取的方式采集重點交互信息數(shù)據(jù),經(jīng)過對單條交互數(shù)據(jù)加工、清洗、挖掘、分類、自動文摘、語義庫管理等工作完成數(shù)據(jù)預處理,并通過對單條交互信息分析、上下文場景分析、真實社會關(guān)系與網(wǎng)絡社會關(guān)系對比分析等,將分析結(jié)果數(shù)據(jù)導入社會關(guān)系信息庫中。 |
