原文服务方: 计算机应用研究       
摘要:
针对现有的图处理和图管理框架存在的效率低下以及数据存储结构等问题,提出了一种适合大规模图数据的处理机制。首先分析了目前的一些图处理模型以及图存储框架的优势与存在的不足。其次,通过对分布式计算的特性分析采取适合大规模图的分割算法、数据抽取的优化以及缓存、计算层与持久层结合机制三方面来设计图数据处理框架。最后通过PageRank和SSSP算法设计实验,与MapReduce框架和采用HDFS作持久层的Spark框架进行性能对比。实验证明提出的框架要比 MapReduce 框架快90倍,比采用 HDFS 作持久层的Spark框架快2倍,能够满足高效率图数据处理的应用前景。
推荐文章
云计算环境下的大规模图状数据处理任务调度算法
大规模图状数据处理
调度算法
粒子群优化
云计算
基于大规模廉价计算平台的海量数据处理系统的研究
分布式计算
数据处理
云计算
电信
一种大规模网络数据缓存方法的改进
网络
海量数据
相空间重构
关联维
基于并行处理机制的数据复用策略研究
并行处理
数据复用
数据仓库
模式匹配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种Spark环境下的高效率大规模图数据处理机制
来源期刊 计算机应用研究 学科
关键词 图计算 内存计算 图数据库 Hadoop Spark PageRank
年,卷(期) 2016,(12) 所属期刊栏目 软件技术研究
研究方向 页码范围 3730-3734,3747
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.12.047
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张学杰 云南大学信息学院 40 337 9.0 16.0
2 王津 云南大学信息学院 2 14 2.0 2.0
3 杨旭涛 云南大学信息学院 2 7 1.0 2.0
4 杨天晴 云南大学信息学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (134)
参考文献  (9)
节点文献
引证文献  (7)
同被引文献  (21)
二级引证文献  (0)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(6)
  • 参考文献(2)
  • 二级参考文献(4)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(9)
  • 参考文献(2)
  • 二级参考文献(7)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
图计算
内存计算
图数据库
Hadoop
Spark
PageRank
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导