基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法.采用一个新的选择属性的测度--属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单.采取了一种新的剪枝方法--预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理.对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当.算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集.
推荐文章
新型偏好敏感决策树算法
决策树
偏好敏感
偏好度
属性选择
代价敏感
分类
决策树构造算法的分析
数据挖掘
决策树
ID3
C4.5
改进的多关系决策树算法
多关系数据挖掘
多关系决策树
元组标志传播
背景属性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Rough集的决策树算法
来源期刊 天津大学学报 学科 工学
关键词 Rough集 决策树 属性分类粗糙度 预剪枝 不相容数据
年,卷(期) 2005,(9) 所属期刊栏目 系统工程
研究方向 页码范围 842-846
页数 5页 分类号 TP18
字数 5113字 语种 中文
DOI 10.3969/j.issn.0493-2137.2005.09.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩文秀 天津大学管理学院 183 4602 34.0 63.0
2 乔梅 天津大学管理学院 7 59 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (18)
同被引文献  (32)
二级引证文献  (102)
1986(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(2)
  • 参考文献(2)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(2)
  • 引证文献(2)
  • 二级引证文献(0)
2008(2)
  • 引证文献(2)
  • 二级引证文献(0)
2009(5)
  • 引证文献(1)
  • 二级引证文献(4)
2010(15)
  • 引证文献(4)
  • 二级引证文献(11)
2011(23)
  • 引证文献(2)
  • 二级引证文献(21)
2012(15)
  • 引证文献(1)
  • 二级引证文献(14)
2013(14)
  • 引证文献(0)
  • 二级引证文献(14)
2014(6)
  • 引证文献(0)
  • 二级引证文献(6)
2015(11)
  • 引证文献(2)
  • 二级引证文献(9)
2016(8)
  • 引证文献(0)
  • 二级引证文献(8)
2017(7)
  • 引证文献(1)
  • 二级引证文献(6)
2018(6)
  • 引证文献(0)
  • 二级引证文献(6)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
Rough集
决策树
属性分类粗糙度
预剪枝
不相容数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
天津大学学报
月刊
0493-2137
12-1127/N
天津大学青年公寓B座414室
chi
出版文献量(篇)
4671
总下载数(次)
14
总被引数(次)
48018
论文1v1指导