基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
最小代价属性选择是数据挖掘的重要问题之一,问题的优化目标是得到总代价最小的属性子集。在实际数据的获取过程中,测量误差是不可避免的。基于测量误差,目前已有一些相关的最小代价属性选择方法。但这些方法存在效率上的问题,特别是对大规模数据集。为解决这一关键问题,提出一种基于误差数据的最小代价属性选择分治算法。该算法将数据集按列拆分为若干个互不相交的子数据集,实现对各子数据集的求解,分而治之。对于不同规模的数据集,其子数据集的大小及总个数并非固定不变,而是根据各数据集的规模自适应设定的。该算法通过拆分数据集来降低问题规模,有效地提高了计算效率。对6个不同规模UCI数据集的实验分析表明该算法的有效性,与经典回溯算法相比,该算法的效果相当但效率至少提高了30%,更能适应实际问题的需要。
推荐文章
动态误分类代价下代价敏感属性选择分治算法
粗糙集
代价敏感
属性选择
动态误分类代价
自适应分治
分治策略下的代价敏感属性选择回溯算法
粗糙集
粒计算
代价敏感
属性选择
自适应分治
代价敏感最优误差边界选择
粗糙集
测量误差
代价敏感
属性选择
多代价下的代价敏感属性选择算法比较
粗糙集
粒计算
代价敏感
属性选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于误差数据的最小代价属性选择分治算法
来源期刊 南京大学学报(自然科学版) 学科 工学
关键词 粗糙集 代价敏感 属性选择 测量误差 自适应分治
年,卷(期) 2016,(5) 所属期刊栏目
研究方向 页码范围 890-898
页数 9页 分类号 TP181
字数 5730字 语种 中文
DOI 10.13232/j.cnki.jnju.2016.05.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵红 闽南师范大学粒计算及其应用重点实验室 12 34 3.0 5.0
2 黄伟婷 闽南师范大学计算机学院 7 5 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (22)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(5)
  • 参考文献(2)
  • 二级参考文献(3)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(4)
  • 参考文献(3)
  • 二级参考文献(1)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
粗糙集
代价敏感
属性选择
测量误差
自适应分治
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京大学学报(自然科学版)
双月刊
0469-5097
32-1169/N
江苏省南京市南京大学
chi
出版文献量(篇)
2526
总下载数(次)
6
总被引数(次)
23071
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导