一種微博用戶挖掘方法及裝置

基本信息

申請?zhí)?/td> CN201310321021.9 申請日 -
公開(公告)號 CN103345535B 公開(公告)日 2017-03-29
申請公布號 CN103345535B 申請公布日 2017-03-29
分類號 G06F17/30(2006.01)I 分類 計算;推算;計數(shù);
發(fā)明人 易卉芹 申請(專利權)人 人民搜索網(wǎng)絡股份公司
代理機構 北京集佳知識產(chǎn)權代理有限公司 代理人 王寶筠
地址 100026 北京市朝陽區(qū)金臺西路2號[4-1]15幢3層370室
法律狀態(tài) -

摘要

摘要 一種微博用戶挖掘方法及裝置,包括:判斷用戶列表中是否存在未處理用戶;如果不存在,則按照預設規(guī)則從微博網(wǎng)頁中抓取用戶數(shù)據(jù),并判斷用戶數(shù)據(jù)對應的抓取用戶是否存在于用戶列表,如果不存在,則將該抓取用戶添加至用戶列表,并設置該抓取用戶的狀態(tài)為已處理;如果存在,則判斷該未處理用戶是否具有下級用戶:如果具有,則獲取該未處理用戶的下級用戶,并將下級用戶添加到用戶列表,設置未處理用戶的狀態(tài)為已處理;將下級用戶作為未處理用戶,繼續(xù)執(zhí)行判斷未處理用戶是否具有下級用戶的步驟;如果不具有,則設置該未處理用戶的狀態(tài)為已處理。一方面可降低挖掘結果對種子用戶選取的依賴性;另一方面還可提高用戶覆蓋面,挖掘出盡量多的微博用戶。