作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
或许MateiN年只是想为Mesos这把“屠龙宝刀”的顺利测评造一条小龙出来,结果无心插柳,Spark已开始侵占Hadoop的地盘,在批处理、流计算、机器学习、图计算等领域发挥效力。本文将着重探索Spark)框架与MLlib的适配,以及MLlib中机器学习算法向量参数的模式与性能,即依托于RDD这种编程抽象,以向量为参数的机器学习算法应该怎样写才能获得最佳的处理能力。
推荐文章
基于Spark的分布式交通流数据预测系统
交通流预测
分布式计算
Spark平台
梯度优化决策树模型
基于Spark的分布式大数据分析建模系统的设计与实现
分布式大数据
Spark
数据分析
数据建模
非结构化数据
故障诊断
一种Spark下分布式DBN并行加速策略
分布内存计算框架
缓存替换
范围分区
深度信念网络
数据倾斜
基于Spark的分布式车流量检测方法设计与实现
分布式计算框架
帧差法
车流量检测
计算机视觉
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Spark与MLlib:当机器学习遇见分布式系统
来源期刊 程序员 学科 工学
关键词 机器学习算法 分布式系统 向量参数 批处理 RDD 计算 编程
年,卷(期) 2014,(7) 所属期刊栏目
研究方向 页码范围 112-115
页数 4页 分类号 TP181
字数 语种
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习算法
分布式系统
向量参数
批处理
RDD
计算
编程
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
程序员
月刊
1672-3252
11-5038/G2
16开
北京市朝阳区广顺北大街33号院1号楼福码
2-665
2000
chi
出版文献量(篇)
10184
总下载数(次)
35
总被引数(次)
6420
论文1v1指导