作者:
原文服务方: 现代电子技术       
摘要:
为提升数据挖掘中聚类分析的效果,在分析数据挖掘、聚类分析、传统K-means算法的基础上,提出一种改进的K-means算法.首先将整体数据集分为k类,然后设定一个密度参数为?,该密度参数反映数据库中数据所处区域的密度大小,?值与密度大小成正比,通过密度参数优化k个样本数据的聚类中心点选取;依据欧几里得距离公式对未选取的其他数据到各个聚类中心之间的距离进行计算,同时以此距离为判别标准,对各个数据进行种类划分,从而得到初始的聚类分布;初始聚类分布得到之后,对每一个分布簇进行再一次的中心点计算,并判断与之前所取中心点是否相同,直到其聚类收敛达到最优效果.最后通过葡萄酒数据集对改进算法进行验证分析,改进算法比传统K-means算法的聚类效果更优,能够更好地在数据挖掘当中进行聚类.
推荐文章
基于数据抽样的自动k-means聚类算法
k-means算法
信息熵
最优样本抽取
有效性指标
基于变异的k-means聚类算法
聚类
mk-means算法
变异
K-means聚类算法的研究
数据挖掘
K-means算法
初始聚类中心
聚类分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于划分的数据挖掘K-means聚类算法分析
来源期刊 现代电子技术 学科
关键词 数据挖掘 聚类分析 K-means聚类算法 聚类中心选取 K-means算法改进 初始中心点
年,卷(期) 2020,(3) 所属期刊栏目 通信与信息工程
研究方向 页码范围 14-17
页数 4页 分类号 TN911.1-34
字数 语种 中文
DOI 10.16652/j.issn.1004-373x.2020.03.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曾俊 长江师范学院大数据与智能工程学院 7 30 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (97)
共引文献  (1199)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(9)
  • 参考文献(0)
  • 二级参考文献(9)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(11)
  • 参考文献(0)
  • 二级参考文献(11)
2011(11)
  • 参考文献(1)
  • 二级参考文献(10)
2012(5)
  • 参考文献(3)
  • 二级参考文献(2)
2013(9)
  • 参考文献(0)
  • 二级参考文献(9)
2014(8)
  • 参考文献(0)
  • 二级参考文献(8)
2015(8)
  • 参考文献(0)
  • 二级参考文献(8)
2016(8)
  • 参考文献(0)
  • 二级参考文献(8)
2017(8)
  • 参考文献(3)
  • 二级参考文献(5)
2018(3)
  • 参考文献(2)
  • 二级参考文献(1)
2020(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据挖掘
聚类分析
K-means聚类算法
聚类中心选取
K-means算法改进
初始中心点
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导