基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大数据的规模效应给数据存储、管理以及数据分析带来了极大的挑战,高效率低成本的大数据处理技术成为学术界及工业界的研究热点.为提高协同过滤算法的执行效率,对MapReduce架构下的算法执行步骤进行了分解,并对算法执行缺陷进行了分析.结合Spark适于迭代型及交互型任务的特点,提出将算法从MapReduce平台移植Spark平台的改进思路.设计了算法在Spark中的实现流程,并通过参数调整、内存优化等方法进一步提高算法效率.实验结果表明:与MapReduce平台中的算法相比,基于Spark DAG调度的算法能够减少65%以上的HDFS重复I/O操作,执行效率与能耗效率分别提升近200%及50%.
推荐文章
基于Spark的混合协同过滤算法改进与实现
集成学习
协同过滤
稀疏性
扩展性
Spark流式计算
增量模型
分类
基于组合优化理论的协同过滤推荐算法
局部
组合优化理论
协同过滤
推荐算法
稀疏问题
评分精度
协同过滤算法的研究
推荐系统
协同过滤
基于用户的算法
基于物品的算法
基于标签优化的协同过滤推荐算法
标签
拓展近邻
协同过滤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark DAG优化MapReduce协同过滤算法
来源期刊 中山大学学报(自然科学版) 学科 工学
关键词 协同过滤 MapReduce Spark 算法优化 能耗优化
年,卷(期) 2017,(3) 所属期刊栏目
研究方向 页码范围 46-56
页数 11页 分类号 TP393.09
字数 6079字 语种 中文
DOI 10.13471/j.cnki.acta.snus.2017.03.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于炯 新疆大学信息科学与工程学院 176 1315 20.0 28.0
2 廖彬 新疆财经大学统计与信息学院 34 172 8.0 10.0
3 张陶 新疆大学信息科学与工程学院 16 95 7.0 9.0
7 国冰磊 新疆大学信息科学与工程学院 21 90 6.0 8.0
8 张旭光 新疆财经大学统计与信息学院 5 21 2.0 4.0
9 刘炎 清华大学软件学院 10 43 5.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (104)
共引文献  (1797)
参考文献  (22)
节点文献
引证文献  (7)
同被引文献  (13)
二级引证文献  (5)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(13)
  • 参考文献(2)
  • 二级参考文献(11)
2009(12)
  • 参考文献(1)
  • 二级参考文献(11)
2010(22)
  • 参考文献(6)
  • 二级参考文献(16)
2011(16)
  • 参考文献(1)
  • 二级参考文献(15)
2012(17)
  • 参考文献(0)
  • 二级参考文献(17)
2013(14)
  • 参考文献(7)
  • 二级参考文献(7)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(4)
  • 引证文献(4)
  • 二级引证文献(0)
2019(5)
  • 引证文献(3)
  • 二级引证文献(2)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
协同过滤
MapReduce
Spark
算法优化
能耗优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中山大学学报(自然科学版)
双月刊
0529-6579
44-1241/N
大16开
广东省广州市新港西路135号
46-15
1955
chi
出版文献量(篇)
5017
总下载数(次)
6
总被引数(次)
45576
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
新疆维吾尔自治区自然科学基金
英文译名:
官方网址:
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导