一種基于相似度估計(jì)的分布式PageRank加速方法

基本信息

申請(qǐng)?zhí)?/td> CN201711481710.0 申請(qǐng)日 -
公開(公告)號(hào) CN110020087B 公開(公告)日 2021-11-09
申請(qǐng)公布號(hào) CN110020087B 申請(qǐng)公布日 2021-11-09
分類號(hào) G06F16/953 分類 計(jì)算;推算;計(jì)數(shù);
發(fā)明人 尤佳莉;張欣;薛寒星;劉學(xué) 申請(qǐng)(專利權(quán))人 北京中科視云科技有限公司
代理機(jī)構(gòu) 北京方安思達(dá)知識(shí)產(chǎn)權(quán)代理有限公司 代理人 陳琳琳;武玥
地址 100190 北京市海淀區(qū)北四環(huán)西路21號(hào)
法律狀態(tài) -

摘要

摘要 本發(fā)明提供了一種基于相似度估計(jì)的分布式PageRank加速方法,所述方法包括:步驟1)以網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)作為中心節(jié)點(diǎn),構(gòu)建中心節(jié)點(diǎn)與網(wǎng)絡(luò)臨近節(jié)點(diǎn)之間連接關(guān)系的子圖;每個(gè)子圖計(jì)算代表自身后繼元集信息的特征向量;步驟2)當(dāng)前子圖計(jì)算相遇對(duì)象的后繼元集和自身頂點(diǎn)集的相似度,根據(jù)預(yù)設(shè)閾值,決定是否將相遇對(duì)象的ID加入自身的候選列表;步驟3)當(dāng)前子圖將相遇對(duì)象的候選列表中子圖加入自身候選列表,相遇對(duì)象將當(dāng)前子圖的候選列表中子圖加入自身候選列表;步驟4)計(jì)算當(dāng)前子圖的頂點(diǎn)集與所有候選對(duì)象的后繼元集的相似度,取相似度最大的作為下次正式相遇的對(duì)象;步驟5)根據(jù)相遇時(shí)兩個(gè)子圖之間的交互操作,計(jì)算并更新當(dāng)前子圖中所有的PageRank值。