基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据的时代里,实现高效的大数据的机器学习系统,需要开发人员要搭建一个计算机机器学习系统,并且该系统能够同时完成机器学习和大规模数据处理的任务.现有的训练数据集重复使用,场景信息较少,已经不能满足大规模机器训练的需要,所以需要包含大规模数据、分布式的计算机系统完成训练.本文介绍了现有大数据机器学习基本概念和一种称为Spark的大数据分布式计算方法.
推荐文章
基于Spark的分布式大数据机器学习算法
数据压缩
偏向抽样
随机梯度下降
神经网络
支持向量机
基于Hadoop分布式系统的地质环境大数据框架探讨
大数据
地质环境数据
Hadoop生态系统
云计算
Spark框架下利用分布式NBC的大数据文本分类方法
文本分类
MapReduce
Spark框架
分布式
朴素贝叶斯分类器
机器学习
分布式并行数据挖掘计算框架及其算法研究
数据挖掘
关联规则
项集
分布式并行结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分布式计算框架的大数据机器学习
来源期刊 数字技术与应用 学科 工学
关键词 机器学习 大数据 分布计算模型
年,卷(期) 2018,(9) 所属期刊栏目 应用研究
研究方向 页码范围 27-28
页数 2页 分类号 TP311.13
字数 2250字 语种 中文
DOI 10.19695/j.cnki.cn12-1369.2018.09.13
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王玥 中国电子科技集团公司第二十八研究所 2 16 2.0 2.0
2 罗珅 中国电子科技集团公司第二十八研究所 4 5 2.0 2.0
3 张维 中国电子科技集团公司第二十八研究所 5 9 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (158)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (21)
二级引证文献  (0)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(4)
  • 参考文献(0)
  • 二级参考文献(4)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
机器学习
大数据
分布计算模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字技术与应用
月刊
1007-9416
12-1369/TN
16开
天津市
6-251
1983
chi
出版文献量(篇)
20434
总下载数(次)
106
总被引数(次)
35701
论文1v1指导