基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
分类是数据挖掘的一个重要研究方向,使用决策树进行分类是一种常用而且高效的分类方法.目前传统的算法有ID3、C4.5、CART等.这些算法都有如下的局限性:必须人工输入归类集合,划分属性,确定最优的分类集合.为了解决这些问题,本文做了如下工作:①提出信息增益排列GEP染色体头部的思想;②给出基于信息增益的GEP构造决策树属性约简算法(IG-GEPDTAR)并用实验进行验证;③实验表明该算法构造的决策树在具有100%准确性的同时,比使用GEP算法构造的决策树减少了冗余分支,其节点数比传统的ID3算法和PID算法构造的决策树的节点数分别减少了82.9%和31.2%.
推荐文章
基于一致性度量属性约简的决策树构建优化研究
粗糙集
属性约简
决策树
一致性
基于粗糙集与属性值聚类的决策树改进算法
粗糙集理论
决策树
属性约简
ID3算法
信息熵
基于信息增益的属性约简算法
粗集
属性约简
信息增益
属性频率划分和信息熵离散化的决策树算法
决策树
粗糙集
属性频率
信息熵
离散化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于信息增益和GEP的决策树属性约简算法
来源期刊 广西师范大学学报(自然科学版) 学科 工学
关键词 GEP 信息增益 决策树归纳
年,卷(期) 2010,(3) 所属期刊栏目
研究方向 页码范围 113-117
页数 分类号 TP301.6
字数 3197字 语种 中文
DOI 10.3969/j.issn.1001-6600.2010.03.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 元昌安 广西师范学院计算机与信息工程学院 121 1400 21.0 33.0
2 王艳 广西师范学院师园学院 74 368 10.0 16.0
3 刘富田 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (13)
参考文献  (5)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(4)
  • 参考文献(1)
  • 二级参考文献(3)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(1)
  • 二级参考文献(4)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
GEP
信息增益
决策树归纳
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西师范大学学报(自然科学版)
双月刊
1001-6600
45-1067/N
大16开
桂林市育才路15号
48-54
1957
chi
出版文献量(篇)
3550
总下载数(次)
1
总被引数(次)
13610
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导