基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对粗糙集及主要机器学习算法一般都无法高效处理连续数据的问题,提出一种基于CACC的连续数据离散化的改进算法.该算法采用CACC标准选取断点,通过增加数据不一致率约束条件,从而减少数据丢失信息量.仿真结果表明,CACC改进算法与Modified Chi2、Extent-Chi2、CAIM、CACC算法相比,并通过C4.5和SVM算法验证,数据识别率和精度可提高近8%.
推荐文章
基于信息增益的多连续属性离散化算法改进
离散化
多连续属性
信息增益
连续属性离散化算法比较研究
离散化
贪心算法
属性重要性
信息熵
聚类
基于数据分区的连续属性整体离散化方法研究
归纳学习
离散化
数据分区
整体离散化
决策连续形式背景的可视化数据离散化方法
形式背景
离散化
可视化
形式概念分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于CACC的连续数据离散化改进算法
来源期刊 计算机工程 学科 工学
关键词 粗糙集 离散化 重要属性 不一致率 CACC改进算法 精度
年,卷(期) 2013,(4) 所属期刊栏目 先进计算与数据处理
研究方向 页码范围 48-51
页数 4页 分类号 TP18
字数 4037字 语种 中文
DOI 10.3969/j.issn.1000-3428.2013.04.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 江虹 西南科技大学信息工程学院 82 268 8.0 11.0
2 刘小龙 西南科技大学信息工程学院 2 15 2.0 2.0
3 吴丹 3 9 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (25)
参考文献  (10)
节点文献
引证文献  (9)
同被引文献  (34)
二级引证文献  (22)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(8)
  • 参考文献(1)
  • 二级参考文献(7)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(8)
  • 参考文献(2)
  • 二级参考文献(6)
2011(5)
  • 参考文献(3)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2017(5)
  • 引证文献(1)
  • 二级引证文献(4)
2018(12)
  • 引证文献(1)
  • 二级引证文献(11)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
粗糙集
离散化
重要属性
不一致率
CACC改进算法
精度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导