基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为提高协同过滤算法在大数据环境下的可扩展性以及在高维稀疏数据下的推荐精度,基于Spark平台实现了一种分层联合聚类协同过滤算法.利用联合聚类对数据集进行稀疏性处理并构建聚类模型,运用层次分析模型并结合评分密集度分析联合聚类模型中用户和项目潜在类别权重,由此进行项目相似度计算并构建项目最近邻居集合,完成在线推荐.通过在GroupLens提供的不同规模MovieLens数据集上实验表明,改进后的算法能够明显提高推荐的准确度,并且在分布式环境下具有良好的推荐效率和可扩展性.
推荐文章
基于Spark的并行ALS协同过滤算法研究
ALS
协同过滤
矩阵分解
HighAvailable
Spark
基于Spark的协同过滤算法并行化研究
协同过滤
Spark平台
并行化
基于项目
基于Spark的混合协同过滤算法改进与实现
集成学习
协同过滤
稀疏性
扩展性
Spark流式计算
增量模型
分类
基于Spark框架的改进协同过滤算法
协同过滤
Spark
稀疏数
相似度计
等值连接
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于Spark的改进协同过滤算法研究
来源期刊 计算机应用与软件 学科 工学
关键词 协同过滤 联合聚类 层次分析模型 Spark
年,卷(期) 2017,(5) 所属期刊栏目 算法
研究方向 页码范围 247-254,278
页数 9页 分类号 TP3
字数 7286字 语种 中文
DOI 10.3969/j.issn.1000-386x.2017.05.043
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 董永峰 河北工业大学计算机科学与软件学院 52 339 11.0 16.0
3 许智宏 河北工业大学计算机科学与软件学院 28 126 5.0 10.0
9 蒋新宇 河北工业大学计算机科学与软件学院 2 20 2.0 2.0
10 赵嘉伟 河北工业大学计算机科学与软件学院 2 20 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (21)
共引文献  (235)
参考文献  (5)
节点文献
引证文献  (7)
同被引文献  (25)
二级引证文献  (12)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(14)
  • 引证文献(4)
  • 二级引证文献(10)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
协同过滤
联合聚类
层次分析模型
Spark
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导