基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
缺失数据填补是数据清洗领域的一个重要问题.由于绝大部分局部填补方法基于全部属性进行分类,未考虑对象属性之间的关联性,因此基于不完备集双聚类,提出一种缺失数据填补算法.该算法利用双聚类完美簇的平均平方残基为0及簇内的属性值波动一致的特点,对缺失数据进行填补.通过数学分析,把寻找含有缺失值的最大完美簇问题转化为求解缺失对象与其他对象之间的最大相似属性集问题,在相同的最大相似属性集下,以缺失值的众数作为填补值.采用4组UCI数据集进行实验,结果表明,该算法相比ROUSTIDA算法平均提高了77.13%的填补值精确度.
推荐文章
一种基于双聚类的缺失数据填补方法
缺失数据填补
双聚类
双聚类数据填补
数据清洗
基于相似关系向量的不完备数据补齐算法
粗糙集
不完备信息系统
相似关系向量
可辨识矩阵
不完整数据的聚类研究
不完整数据
K-means聚类
不完整信息系统
基于属性重要性的不完备数据填充算法
不完备系统
数据填充
马氏距离
属性约简
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于不完备集双聚类的缺失数据填补算法
来源期刊 计算机工程 学科 工学
关键词 缺失数据填补 不完备集 双聚类 最大相似属性集 数据清洗 完美簇
年,卷(期) 2016,(4) 所属期刊栏目 体系结构与软件技术
研究方向 页码范围 20-26
页数 7页 分类号 TP311
字数 6251字 语种 中文
DOI 10.3969/j.issn.1000-3428.2016.04.004
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 沈镇林 暨南大学信息管理办公室 10 122 5.0 10.0
2 韩飞 暨南大学信息科学与技术学院 1 15 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (71)
参考文献  (12)
节点文献
引证文献  (15)
同被引文献  (54)
二级引证文献  (19)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(6)
  • 参考文献(3)
  • 二级参考文献(3)
2013(5)
  • 参考文献(2)
  • 二级参考文献(3)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(7)
  • 引证文献(4)
  • 二级引证文献(3)
2019(12)
  • 引证文献(6)
  • 二级引证文献(6)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
缺失数据填补
不完备集
双聚类
最大相似属性集
数据清洗
完美簇
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导