作者:
原文服务方: 计算机测量与控制       
摘要:
为了减少虚拟环境下大数据运行时间,数据运行时能够反映出一定的规律性和特殊的分类性,需要对虚拟环境下大数据进行智能并行聚类;当前大数据聚类方法是根据K-均值聚类方法不断地进行大数据样本分类的调整,经过多次计算调整后达到数据并行聚类的效果,但每当有新的大数据流入时,都需要对当前全部数据进行K-均值聚类,计算过程复杂,聚类效率低;为此,提出了一种基于MapReduce的虚拟环境下大数据智能并行聚类方法;首先在虚拟环境下大数据中抽取小规模数据集并确定大数据簇的质心,采用Single法对所抽样的小规模数据进行聚类,获得虚拟环境下大数据属性的均值,利用最小距离分类规则将大数据属性的均值快速地向数据簇的真实中心移动,依据Davies bouldin指标假设一个数据簇离散度参数,在此参数值中选出大数据智能并行聚类相似度最大值,最后利用聚类相似度最大值得到Davies-bouldin指数,以Davies-bouldin指数为基础将多个类别的质心间距以及聚类离散度指定阈值合并为一个类并进行迭代计算,得到数据最佳聚类中心位置,由此完成虚拟环境下大数据智能并行聚类;仿真实验结果证明,所提方法提高了大数据智能并行聚类的灵活性和普遍适用性,减少了聚类时间,并适合应用于教育技术领域,不仅可以使教育技术网络数据更加合理化,而且更加规范化.
推荐文章
云环境下基于群智能算法的大数据聚类挖掘技术
大数据聚类挖掘
云环境
群智能算法
数据挖掘
并行化聚类挖掘
数据密度计算
智能虚拟环境的研究
虚拟环境
Agent
人工生命
计算机图形
基于MapReduce并行化计算的大数据聚类算法
大数据
MapReduce
并行计算
数据聚类
云环境下基于群智能算法的大数据聚类挖掘技术
大数据聚类挖掘
云计算模型分析
聚类分析
聚类算法设计
算法优化
聚类算法改进
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 虚拟环境下大数据智能并行聚类方法研究
来源期刊 计算机测量与控制 学科
关键词 虚拟环境 大数据 智能并行 聚类方法
年,卷(期) 2017,(6) 所属期刊栏目 设计与应用
研究方向 页码范围 257-260
页数 4页 分类号 TP311
字数 语种 中文
DOI 10.16526/j.cnki.11-4762/tp.2017.06.069
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 屈洁 宝鸡文理学院教育学院 15 25 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (97)
共引文献  (43)
参考文献  (10)
节点文献
引证文献  (3)
同被引文献  (33)
二级引证文献  (2)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1957(1)
  • 参考文献(0)
  • 二级参考文献(1)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(2)
  • 参考文献(0)
  • 二级参考文献(2)
1974(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(2)
  • 参考文献(0)
  • 二级参考文献(2)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(8)
  • 参考文献(0)
  • 二级参考文献(8)
2012(11)
  • 参考文献(0)
  • 二级参考文献(11)
2013(7)
  • 参考文献(0)
  • 二级参考文献(7)
2014(17)
  • 参考文献(0)
  • 二级参考文献(17)
2015(7)
  • 参考文献(3)
  • 二级参考文献(4)
2016(12)
  • 参考文献(6)
  • 二级参考文献(6)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(3)
  • 引证文献(1)
  • 二级引证文献(2)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
虚拟环境
大数据
智能并行
聚类方法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机测量与控制
月刊
1671-4598
11-4762/TP
大16开
北京市海淀区阜成路甲8号
1993-01-01
出版文献量(篇)
0
总下载数(次)
0
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导