原文服务方: 计算机应用研究       
摘要:
针对现实数据集的数据缺失问题,提出了一种基于双聚类的缺失数据填补新方法.该算法利用双聚类簇内平均平方残值越小簇内数据相似性越高的这一特性,将缺失数据的填补问题转换为求解特定双聚类簇最小平均平方残值的问题,进而实现了数据集中缺失元素的预测;再利用二次函数求解极小值的思想对包含有缺失数据的特定双聚类簇最小平均平方残值的问题进行求解,并进行了数学上的分析证明.最后进行仿真验证,通过观察UCI数据集的实验结果可知,提出的算法具有较高的填补准确性.
推荐文章
基于不完备集双聚类的缺失数据填补算法
缺失数据填补
不完备集
双聚类
最大相似属性集
数据清洗
完美簇
一种基于变分贝叶斯的半监督双聚类算法
双聚类算法
变分贝叶斯
半监督学习
概率模型
一种基于特征聚类的特征选择方法
特征选择
特征聚类
相关度
无监督学习
一种基于Normal矩阵的时间序列聚类方法
时间序列聚类
社团结构
复杂网络
Normal矩阵
相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于双聚类的缺失数据填补方法
来源期刊 计算机应用研究 学科
关键词 缺失数据填补 双聚类 双聚类数据填补 数据清洗
年,卷(期) 2015,(3) 所属期刊栏目 算法研究探讨
研究方向 页码范围 674-678
页数 5页 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.03.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周晓锋 中国科学院沈阳自动化研究所 19 174 7.0 13.0
2 宋宏 中国科学院沈阳自动化研究所 9 94 4.0 9.0
3 郝胜轩 中国科学院沈阳自动化研究所 2 64 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (29)
共引文献  (50)
参考文献  (10)
节点文献
引证文献  (26)
同被引文献  (57)
二级引证文献  (28)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(2)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(9)
  • 参考文献(3)
  • 二级参考文献(6)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(5)
  • 参考文献(2)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2015(5)
  • 引证文献(5)
  • 二级引证文献(0)
2016(8)
  • 引证文献(7)
  • 二级引证文献(1)
2017(13)
  • 引证文献(5)
  • 二级引证文献(8)
2018(15)
  • 引证文献(6)
  • 二级引证文献(9)
2019(9)
  • 引证文献(3)
  • 二级引证文献(6)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
缺失数据填补
双聚类
双聚类数据填补
数据清洗
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导