基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分类是一种常见的数据挖掘方法,而属性值缺失是分类过程中常见的一类数据质量问题,缺失值填充可以减少属性值缺失造成的分类错误.缺失值填充首先要求准确率高,在许多实际应用当中,缺失值填充还必须保证较高的计算效率.提出了一种填充缺失属性值算法APT-KNN,APT-KNN算法利用属性与属性之间的相互关系,根据与目标最相似的几个实例属性值来估计缺失值,以保证填充结果具有更高的准确性,同时设计了一种优化的AntiPole树索引结构,提高了缺失属性值的填充效率.实验表明,APT-KNN方法与现有的几种缺失属性填充方法相比,具有更高的准确率和填充效率.
推荐文章
基于优化最大偏差相似性准则的KNN缺失数据填充算法
智能交通
高速公路
缺失数据填充
聚类算法
基于LPP和l2,1的KNN填充算法
缺失值填充
K最近邻
保局投影
重构
基于模糊规则的随机缺失属性值数据分类算法
缺失属性值
隶属函数
模糊规则
分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 APT-KNN:一种面向分类问题的高效缺失值填充算法
来源期刊 计算机应用与软件 学科 工学
关键词 分类 缺失值填充 索引 数据挖掘 数据准备
年,卷(期) 2011,(4) 所属期刊栏目 基金项目论文
研究方向 页码范围 135-139
页数 分类号 TP311.13
字数 5676字 语种 中文
DOI 10.3969/j.issn.1000-386X.2011.04.040
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱扬勇 复旦大学计算机科学技术学院 91 3435 25.0 58.0
2 熊赟 复旦大学计算机科学技术学院 26 277 7.0 16.0
3 陈诚 复旦大学计算机科学技术学院 22 144 8.0 11.0
4 徐宇明 复旦大学计算机科学技术学院 1 17 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (17)
同被引文献  (22)
二级引证文献  (23)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(10)
  • 引证文献(3)
  • 二级引证文献(7)
2017(8)
  • 引证文献(2)
  • 二级引证文献(6)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(7)
  • 引证文献(4)
  • 二级引证文献(3)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
分类
缺失值填充
索引
数据挖掘
数据准备
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
总被引数(次)
101489
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导