基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于数据规模导致难以应对的存储量、数据规模导致传统算法失效、大数据复杂的数据关联性导致高复杂度的计算等问题,对大数据下的k-means聚类优化算法进行研究,给出了适用于大数据任务处理的MapReduce软件架构的模型机制,通过改进k-means初始聚类中心的选取,提出了一种基于Ma-pReduce模型的k-means聚类优化算法.最后将改进的算法应用于煤炭煤质的分析中,结果显示较传统算法,改进算法的效率有明显提高.
推荐文章
基于划分的数据挖掘K-means聚类算法分析
数据挖掘
聚类分析
K-means聚类算法
聚类中心选取
K-means算法改进
初始中心点
针对多聚类中心大数据集的加速K-means聚类算法
DIACK
加速K-means
聚类
三角定理
基于数据抽样的自动k-means聚类算法
k-means算法
信息熵
最优样本抽取
有效性指标
大数据挖掘中的K⁃means无监督聚类算法的改进
大数据挖掘
差分进化算法
K-means聚类算法
全局寻优
鲁棒性
收敛速度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 大数据k-Means聚类挖掘优化算法
来源期刊 大连交通大学学报 学科
关键词 大数据 数据挖掘 k-means算法 MapReduce模型
年,卷(期) 2015,(3) 所属期刊栏目
研究方向 页码范围 91-94
页数 4页 分类号
字数 2295字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宋旭东 大连交通大学软件学院 38 216 8.0 13.0
2 邱占芝 大连交通大学软件学院 48 368 9.0 18.0
3 朱文辉 大连交通大学软件学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (117)
参考文献  (8)
节点文献
引证文献  (7)
同被引文献  (29)
二级引证文献  (12)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1981(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(12)
  • 参考文献(0)
  • 二级参考文献(12)
2008(4)
  • 参考文献(1)
  • 二级参考文献(3)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(1)
  • 二级引证文献(2)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
2020(8)
  • 引证文献(2)
  • 二级引证文献(6)
研究主题发展历程
节点文献
大数据
数据挖掘
k-means算法
MapReduce模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
大连交通大学学报
双月刊
1673-9590
21-1550/U
大16开
大连市沙河口区黄河路794号
1980
chi
出版文献量(篇)
3012
总下载数(次)
3
总被引数(次)
12659
论文1v1指导