基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传感器节点的资源是有限的,高的通信开销会消耗大量的电量.为了减小分布式流数据分类算法的通信开销,提出一种高效的分布式流数据聚类算法.该算法包含在线局部聚类和离线全局协同聚类两个阶段.在线局部聚类算法将每个流数据源进行局部聚类,并将聚类后的结果通过序列化技术发往协同节点;协同节点得到来自不同流数据源的局部聚类信息后进行全局聚类.从实验中可以看出,当不断增加窗口的大小时,算法用于数据发送的时间恒定不变,算法的聚类时间和总的时间呈线性增长,即所提出算法的执行时间不受滑动窗口宽度和聚类个数的影响;同时该算法与集中式算法的准确性接近,并且通信开销远远小于相关的分布式算法.实验结果表明,该算法具有很好的可扩展性,可应用于对大规模分布式流数据源进行聚类分析.
推荐文章
一种基于代表点的分布式数据流聚类算法
分布式数据流
数据挖掘
聚类
聚类演化
代表点
分布式环境中聚类问题算法研究综述
集中式聚类
分布式聚类
聚类精度
聚类时间
一种基于密度的分布式聚类改进算法
聚类
分布式
数据挖掘
代表点
基于节点数据密度的分布式K-means聚类算法研究
点对点技术
K-means聚类
自适应
置信半径
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高通信效率的分布式流数据聚类算法
来源期刊 计算机应用 学科 工学
关键词 数据通信 数据挖掘 聚类算法 流数据 分布式系统
年,卷(期) 2014,(9) 所属期刊栏目 网络与通信
研究方向 页码范围 2505-2509
页数 5页 分类号 TP319
字数 5678字 语种 中文
DOI 10.11772/j.issn.1001-9081.2014.09.2505
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱强 浙江传媒学院教育技术中心 20 47 5.0 6.0
2 孙玉强 常州大学数理学院 19 65 5.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (22)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据通信
数据挖掘
聚类算法
流数据
分布式系统
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导