基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
连续属性离散化足机器学习和数据挖掘领域中的一个重要问题,离散化是否合理决定着表达和提取相关信息的准确性.经过研究Chi2系列算法,提出一种新的基于属性最要性的连续属性离散化方法-Imp-Chi2算法,该算法依据属性重要性程度对属性离散化的顺序进行了合理的调整,能够更准确地对连续属性进行离散化.文章通过C4.5和支持向量机分别对离散化后的结果进行了实验,在实验过程中,提出一种训练集类比例抽取片法,避免了训练集随机抽取的不均匀性.实验结果证明了所提算法的有效性.
推荐文章
连续属性离散化算法比较研究
离散化
贪心算法
属性重要性
信息熵
聚类
连续属性离散化的Bayesian-Chi2算法
连续属性离散化
Chi2算法
贝叶斯
基于信息增益的多连续属性离散化算法改进
离散化
多连续属性
信息增益
粗糙集理论中一种连续属性离散化算法
粗糙集
离散化
断点
条件熵
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 连续属性离散化的Imp-Chi2算法
来源期刊 计算机工程 学科 工学
关键词 连续属性离散化 Chi2算法 属性重要性 训练集类比例抽取
年,卷(期) 2008,(17) 所属期刊栏目 软件技术与数据库
研究方向 页码范围 39-41
页数 3页 分类号 TP18
字数 3675字 语种 中文
DOI 10.3969/j.issn.1000-3428.2008.17.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 闫德勤 辽宁师范大学计算机信息与技术学院 124 1071 15.0 28.0
2 刘磊 辽宁师范大学计算机信息与技术学院 51 667 11.0 25.0
3 梁宏霞 辽宁师范大学计算机信息与技术学院 6 39 4.0 6.0
4 桑雨 辽宁师范大学计算机信息与技术学院 4 22 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (7)
同被引文献  (4)
二级引证文献  (0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
连续属性离散化
Chi2算法
属性重要性
训练集类比例抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导