基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现实应用中常常涉及许多连续的数值属性,而目前许多机器学习算法则要求所处理的属性具有离散值.基于信息论的基本原理,提出一种新的有监督离散化算法WILD,它可以看成是决策树离散化算法的一种扩充,其主要改进在于考虑区间内观测值出现的频度,采用加权信息损耗作为区间离散化的测度,以克服决策树算法离散不均衡的问题.该算法非常自然地采用了自底向上的区间归并方案,可以同时归并多个相邻区间,有利于提高离散化算法的速度.实验结果表明该算法能够提高机器学习算法的精度.
推荐文章
应用有效信息比率的离散化算法
离散化
信息
有效信息比率
基于逐级均值聚类的信息熵的离散化算法
粗糙集
离散化
连续值属性
逐级均值聚类
信息熵
基于信息增益的多连续属性离散化算法改进
离散化
多连续属性
信息增益
基于信息素的离散PSO算法
微粒群优化
信息素
无线传感网络
路由
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WILD:基于加权信息损耗的离散化算法
来源期刊 南京大学学报(自然科学版) 学科 工学
关键词 机器学习 离散化
年,卷(期) 2001,(2) 所属期刊栏目
研究方向 页码范围 148-153
页数 6页 分类号 TP18
字数 3457字 语种 中文
DOI 10.3321/j.issn:0469-5097.2001.02.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李刚 上海大学计算机科学系 19 68 6.0 7.0
2 李霁伦 上海交通大学计算机系 2 13 1.0 2.0
3 童铑 上海大学计算机科学系 1 12 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (12)
同被引文献  (11)
二级引证文献  (34)
2001(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2005(1)
  • 引证文献(1)
  • 二级引证文献(0)
2006(1)
  • 引证文献(1)
  • 二级引证文献(0)
2007(3)
  • 引证文献(3)
  • 二级引证文献(0)
2008(3)
  • 引证文献(2)
  • 二级引证文献(1)
2009(6)
  • 引证文献(1)
  • 二级引证文献(5)
2010(5)
  • 引证文献(1)
  • 二级引证文献(4)
2011(3)
  • 引证文献(1)
  • 二级引证文献(2)
2012(9)
  • 引证文献(1)
  • 二级引证文献(8)
2013(4)
  • 引证文献(0)
  • 二级引证文献(4)
2014(3)
  • 引证文献(1)
  • 二级引证文献(2)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(5)
  • 引证文献(0)
  • 二级引证文献(5)
2017(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
机器学习
离散化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京大学学报(自然科学版)
双月刊
0469-5097
32-1169/N
江苏省南京市南京大学
chi
出版文献量(篇)
2526
总下载数(次)
6
总被引数(次)
23071
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导