基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了一种基于Spark云计算平台的并行数据分析系统。该系统以大规模图数据分析任务为主,并且支持非图数据分析的应用,集成数据分析算法集与非图数据分析算法集。详细阐述了该系统的架构设计,工作流引擎和动态组件更新技术以及部分并行数据分析算法的设计与实现。通过对多种规模的数据集进行性能测试,以及与传统的MapReduce平台进行性能对比,证明了该系统相对于以往的图数据挖掘系统可以更高效地完成计算任务,而且也可以有效进行非图数据分析。
推荐文章
基于Spark的遥感数据分析方法
大数据计算
遥感数据
Hadoop
Spark
MapReduce
基于Spark平台的离群数据并行挖掘算法
大数据技术
离群挖掘
Spark平台
并行挖掘
PDM:基于Hadoop的并行数据分析系统
云计算
Hadoop
并行算法
数据挖掘
社会网络分析
Spark上的等值连接优化
Spark
SQL
大数据分析
等值连接
内存计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的并行图数据分析系统
来源期刊 计算机科学与探索 学科 工学
关键词 云计算 并行算法 图数据分析 数据挖掘 社会网络分析
年,卷(期) 2015,(9) 所属期刊栏目 数据库技术
研究方向 页码范围 1066-1074
页数 9页 分类号 TP311
字数 6930字 语种 中文
DOI 10.3778/j.issn.1673-9418.1411045
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 吴斌 北京邮电大学北京市智能通信软件与多媒体重点实验室 80 1409 15.0 36.0
2 刘旸 北京邮电大学北京市智能通信软件与多媒体重点实验室 3 32 2.0 3.0
3 王虹旭 北京邮电大学北京市智能通信软件与多媒体重点实验室 1 23 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (8)
节点文献
引证文献  (23)
同被引文献  (67)
二级引证文献  (55)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(5)
  • 引证文献(4)
  • 二级引证文献(1)
2017(14)
  • 引证文献(5)
  • 二级引证文献(9)
2018(26)
  • 引证文献(7)
  • 二级引证文献(19)
2019(22)
  • 引证文献(5)
  • 二级引证文献(17)
2020(10)
  • 引证文献(1)
  • 二级引证文献(9)
研究主题发展历程
节点文献
云计算
并行算法
图数据分析
数据挖掘
社会网络分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导