一種基于相似度估計(jì)的分布式PageRank加速方法
基本信息
申請(qǐng)?zhí)?/td> | CN201711481710.0 | 申請(qǐng)日 | - |
公開(公告)號(hào) | CN110020087B | 公開(公告)日 | 2021-11-09 |
申請(qǐng)公布號(hào) | CN110020087B | 申請(qǐng)公布日 | 2021-11-09 |
分類號(hào) | G06F16/953 | 分類 | 計(jì)算;推算;計(jì)數(shù); |
發(fā)明人 | 尤佳莉;張欣;薛寒星;劉學(xué) | 申請(qǐng)(專利權(quán))人 | 北京中科視云科技有限公司 |
代理機(jī)構(gòu) | 北京方安思達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 | 代理人 | 陳琳琳;武玥 |
地址 | 100190 北京市海淀區(qū)北四環(huán)西路21號(hào) | ||
法律狀態(tài) | - |
摘要
摘要 | 本發(fā)明提供了一種基于相似度估計(jì)的分布式PageRank加速方法,所述方法包括:步驟1)以網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)作為中心節(jié)點(diǎn),構(gòu)建中心節(jié)點(diǎn)與網(wǎng)絡(luò)臨近節(jié)點(diǎn)之間連接關(guān)系的子圖;每個(gè)子圖計(jì)算代表自身后繼元集信息的特征向量;步驟2)當(dāng)前子圖計(jì)算相遇對(duì)象的后繼元集和自身頂點(diǎn)集的相似度,根據(jù)預(yù)設(shè)閾值,決定是否將相遇對(duì)象的ID加入自身的候選列表;步驟3)當(dāng)前子圖將相遇對(duì)象的候選列表中子圖加入自身候選列表,相遇對(duì)象將當(dāng)前子圖的候選列表中子圖加入自身候選列表;步驟4)計(jì)算當(dāng)前子圖的頂點(diǎn)集與所有候選對(duì)象的后繼元集的相似度,取相似度最大的作為下次正式相遇的對(duì)象;步驟5)根據(jù)相遇時(shí)兩個(gè)子圖之間的交互操作,計(jì)算并更新當(dāng)前子圖中所有的PageRank值。 |
