基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
不完整数据填充是数据预处理领域重要研究课题.传统数据填充算法时间复杂度高,算法不具有分布式处理特性,不满足大数据环境下对数据快速处理的要求.提出一种基于分布式减法聚类的不完整数据填充算法,算法首先利用改进的减法聚类算法对整个数据集进行聚类.为了提高聚类算法的效率,利用云计算技术对聚类算法进行优化,实现基于多级MapReduce的分布式减法聚类算法.然后根据聚类结果和加权距离对缺失数据值进行填充,在保证数据填充精度的同时大幅度降低了填充过程的处理时间.实验结果表明,本文提出的方法能够对大数据进行快速聚类,同时有效保证缺失数据的填充精度.
推荐文章
不完整数据的聚类研究
不完整数据
K-means聚类
不完整信息系统
基于改进遗传算法的不完整大数据填充挖掘算法
不完整大数据
数据填充
遗传神经网络
基于深度学习的不完整大数据填充算法
深度学习
缺失数据填充
自动编码机
大数据
基于不完整数据分布参数的估计
不完整数据
参数估计
Taylor级数
可靠性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分布式减法聚类的不完整数据填充算法
来源期刊 小型微型计算机系统 学科 工学
关键词 大数据 缺失值填充 减法聚类 MapReduce模型
年,卷(期) 2015,(7) 所属期刊栏目 计算机软件与数据库研究
研究方向 页码范围 1409-1414
页数 6页 分类号 TP301
字数 7857字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵亮 大连理工大学软件学院 75 528 12.0 19.0
2 陈志奎 大连理工大学软件学院 35 238 11.0 14.0
3 张清辰 大连理工大学软件学院 15 132 8.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (322)
参考文献  (14)
节点文献
引证文献  (11)
同被引文献  (52)
二级引证文献  (14)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(5)
  • 引证文献(4)
  • 二级引证文献(1)
2019(11)
  • 引证文献(1)
  • 二级引证文献(10)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
大数据
缺失值填充
减法聚类
MapReduce模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
小型微型计算机系统
月刊
1000-1220
21-1106/TP
大16开
辽宁省沈阳市东陵区南屏东路16号
8-108
1980
chi
出版文献量(篇)
11026
总下载数(次)
17
总被引数(次)
83133
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导