基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于工业领域广泛用到的Hadoop分布式计算平台,使用Canopy+K-means算法对手写数字进行聚类研究.针对传统Canopy算法初始阈值的确定问题,引入“最大最小化原则”确定初始阈值,计算得到K-means算法所需的初始聚类中心点.实验结果表明,Canopy算法能够较大程度地提高K-means算法的正确率.
推荐文章
基于 MapReduce 的分布式 AP 聚类算法
MapReduce模型
分布式AP聚类算法
Hadoop
基于Hadoop分布式改进聚类协同过滤推荐算法研究
协同过滤
Hadoop
矩阵分解
聚类
分布式计算
基于Hadoop MapReduce的分布式数据流聚类算法研究
数据挖掘
聚类
数据流聚类
分布式聚类
Hadoop MapReduce
基于密度的分布式聚类算法研究
数据挖掘
分布式聚类
特殊核心对象
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的分布式聚类算法研究
来源期刊 山东理工大学学报(自然科学版) 学科 工学
关键词 Hadoop 聚类 K-means算法 Canopy算法 手写数字识别
年,卷(期) 2018,(4) 所属期刊栏目
研究方向 页码范围 25-29
页数 5页 分类号 TP301
字数 3921字 语种 中文
DOI 10.3969/j.issn.1672-6197.2018.04.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘晓红 山东理工大学计算机科学与技术学院 36 176 6.0 12.0
2 曲志坚 山东理工大学计算机科学与技术学院 18 88 4.0 9.0
3 吴德超 山东理工大学计算机科学与技术学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (31)
共引文献  (45)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (2)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(4)
  • 参考文献(2)
  • 二级参考文献(2)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop
聚类
K-means算法
Canopy算法
手写数字识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
山东理工大学学报(自然科学版)
双月刊
1672-6197
37-1412/N
大16开
山东省淄博市张周路12号
1985
chi
出版文献量(篇)
2724
总下载数(次)
4
总被引数(次)
12440
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导