基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
P-Rank是SimRank的扩展形式,也是一种相似度度量方法,被用来计算网络中任意两个结点的相似性。不同于SimRank只考虑结点的入度信息,P-Rank还加入了结点的出度信息,从而更加客观准确地评价结点间的相似程度。随着大数据时代的到来,P-Rank需要处理的数据日益增大。使用MapReduce等分布式模型实现大规模P-Rank迭代计算的方法,本质上是一种同步迭代方法,不可避免地具有同步迭代方法的缺点:迭代时间(尤其是迭代过程中处理器等待的时间)长,计算速度慢,因此效率低下。为了解决这一问题,采用了一种迭代计算方法--异步累积更新算法。这个算法实现了异步计算,减少了计算过程处理器结点的等待时间,提高了计算速度,节省了时间开销。从异步的角度实现了P-Rank算法,将异步累积更新算法应用在了P-Rank上,并进行了对比实验。实验结果表明该算法有效地提高了计算收敛速度。
推荐文章
基于拟态计算的大数据高效能平台设计方法
大数据
拟态计算
算粒
匹配矩阵
能效比
云计算设备中的大数据特征高效分类挖掘方法研究
云计算
大数据
特征提取
分类挖掘
基于P-Rank的RDF有向图的分布式存储
资源描述框架
有向图
P-Rank
AP聚类
云计算环境下的大数据特征挖掘技术研究
云计算
梯度采样
大数据
存储体系
特征挖掘
能量开销
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据下基于异步累积更新的高效P-Rank计算方法
来源期刊 软件学报 学科 工学
关键词 异步累积更新 大数据 相似度 P-Rank 大规模计算
年,卷(期) 2014,(9) 所属期刊栏目 大数据分析专刊
研究方向 页码范围 2136-2148
页数 13页 分类号 TP311
字数 9939字 语种 中文
DOI 10.13328/j.cnki.jos.004637
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈红 中国人民大学信息学院数据仓库与商务智能实验室 86 978 16.0 29.0
2 李翠平 中国人民大学信息学院数据仓库与商务智能实验室 20 297 8.0 17.0
3 王旭丛 中国人民大学信息学院计算机系 1 6 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (6)
同被引文献  (9)
二级引证文献  (5)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
异步累积更新
大数据
相似度
P-Rank
大规模计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家社会科学基金
英文译名:Philosophy and Social Science Foundation of China
官方网址:http://www.npopss-cn.gov.cn/
项目类型:重点项目
学科类型:马列·科社
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导