基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为提高智能模型的识别精度,增强其泛化能力,需要对用于智能建模的数据集中的对象类别异常进行检测和修正.在进行数据集和决策树形式化描述的基础上,将基尼指数增益率作为确定连续条件属性最优二分原则,采用递归算法生成叶节点中对象为同一类别的二叉决策树.利用信息熵评价决策树剪除叶节点中对象的类别分布效果,实现数据集类别异常的类别修正.决策树的生成和剪枝本质上是完成基于基尼指数和信息熵的连续条件属性数据空间分割和合并类别修正.实验和实际应用验证了决策树生成和剪枝是数据集类别优化的有效方法.
推荐文章
一种改进决策树剪枝算法的研究
决策树
剪枝
MDL
分类器
预测精度
C4.5
CDC与REP结合的决策树剪枝优化算法
决策树
剪枝
CDC算法
REP算法
叶子节点
一种单位代价收益决策树剪枝算法
代价
收益
剪枝算法
决策树
基于RST的决策树生成与剪枝方法
明确区
非明确区
明确度
深度拟合率
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于决策树生成及剪枝的数据集优化及其应用
来源期刊 计算机工程与设计 学科 工学
关键词 信息熵 基尼指数 决策树 剪枝 数据优化
年,卷(期) 2018,(1) 所属期刊栏目 智能技术
研究方向 页码范围 205-211
页数 7页 分类号 TP181
字数 6957字 语种 中文
DOI 10.16208/j.issn1000-7024.2018.01.036
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (129)
共引文献  (208)
参考文献  (13)
节点文献
引证文献  (18)
同被引文献  (11)
二级引证文献  (5)
1941(1)
  • 参考文献(0)
  • 二级参考文献(1)
1951(1)
  • 参考文献(0)
  • 二级参考文献(1)
1968(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1971(1)
  • 参考文献(0)
  • 二级参考文献(1)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(2)
  • 参考文献(0)
  • 二级参考文献(2)
1986(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(2)
  • 参考文献(0)
  • 二级参考文献(2)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(8)
  • 参考文献(0)
  • 二级参考文献(8)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(10)
  • 参考文献(0)
  • 二级参考文献(10)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(13)
  • 参考文献(0)
  • 二级参考文献(13)
2011(7)
  • 参考文献(0)
  • 二级参考文献(7)
2012(10)
  • 参考文献(3)
  • 二级参考文献(7)
2013(10)
  • 参考文献(5)
  • 二级参考文献(5)
2014(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(4)
  • 参考文献(2)
  • 二级参考文献(2)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2018(4)
  • 引证文献(4)
  • 二级引证文献(0)
2019(15)
  • 引证文献(12)
  • 二级引证文献(3)
2020(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
信息熵
基尼指数
决策树
剪枝
数据优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导