基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
实例选择能有效移除数据中的噪声和冗余数据,但现有方法难以在提高泛化能力的同时实现约简。针对该问题,提出一种冗余实例对消除算法用于实例选择。给出最近同类实例对的概念,计算数据集中存在的最近同类实例对,并移除满足条件的实例,在11个不同数据集上进行的仿真实验结果表明,经过该算法处理后的数据集在分类准确率和存储压缩率上较原始样本集有明显提升。对比剪辑最近邻规则算法,该算法能够在保持分类准确率的同时提高平均存储压缩率35%以上,并完整保留原始样本集的数据分布特征,在分类准确率和存储压缩率上取得折中。
推荐文章
一种网络冗余流量消除算法
网络
冗余流量
消除
抽样
XML多值依赖及其消除冗余模式的算法
规范化
函数依赖
多值依赖
实例化视图选择算法PBC
数据仓库
数据立方体
实例化视图
基于主动特征选择的在线加权多实例目标跟踪
费舍尔信息
主动特征选择
权重多实例学习
加权和模型
“漂移”现象
目标跟踪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于冗余实例对消除算法的实例选择
来源期刊 计算机工程 学科 工学
关键词 实例选择 最近同类实例对 k最近邻 剪辑最近邻规则算法 数据约简 机器学习
年,卷(期) 2014,(1) 所属期刊栏目 人工智能及识别技术
研究方向 页码范围 177-180
页数 4页 分类号 TP18
字数 3436字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.01.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘衍珩 吉林大学计算机科学与技术学院 99 816 14.0 25.0
2 孙鑫 吉林大学计算机科学与技术学院 25 148 5.0 12.0
3 高强 吉林大学计算机科学与技术学院 12 38 4.0 6.0
4 刘璐 吉林大学计算机科学与技术学院 55 268 8.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (24)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (14)
二级引证文献  (9)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
实例选择
最近同类实例对
k最近邻
剪辑最近邻规则算法
数据约简
机器学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
论文1v1指导