一種微博用戶挖掘方法及裝置
基本信息
申請?zhí)?/td> | CN201310321021.9 | 申請日 | - |
公開(公告)號 | CN103345535B | 公開(公告)日 | 2017-03-29 |
申請公布號 | CN103345535B | 申請公布日 | 2017-03-29 |
分類號 | G06F17/30(2006.01)I | 分類 | 計算;推算;計數(shù); |
發(fā)明人 | 易卉芹 | 申請(專利權)人 | 人民搜索網(wǎng)絡股份公司 |
代理機構 | 北京集佳知識產(chǎn)權代理有限公司 | 代理人 | 王寶筠 |
地址 | 100026 北京市朝陽區(qū)金臺西路2號[4-1]15幢3層370室 | ||
法律狀態(tài) | - |
摘要
摘要 | 一種微博用戶挖掘方法及裝置,包括:判斷用戶列表中是否存在未處理用戶;如果不存在,則按照預設規(guī)則從微博網(wǎng)頁中抓取用戶數(shù)據(jù),并判斷用戶數(shù)據(jù)對應的抓取用戶是否存在于用戶列表,如果不存在,則將該抓取用戶添加至用戶列表,并設置該抓取用戶的狀態(tài)為已處理;如果存在,則判斷該未處理用戶是否具有下級用戶:如果具有,則獲取該未處理用戶的下級用戶,并將下級用戶添加到用戶列表,設置未處理用戶的狀態(tài)為已處理;將下級用戶作為未處理用戶,繼續(xù)執(zhí)行判斷未處理用戶是否具有下級用戶的步驟;如果不具有,則設置該未處理用戶的狀態(tài)為已處理。一方面可降低挖掘結果對種子用戶選取的依賴性;另一方面還可提高用戶覆蓋面,挖掘出盡量多的微博用戶。 |
