原文服务方: 杭州电子科技大学学报(自然科学版)       
摘要:
实际问题中经常涉及连续的数值属性,然而许多归纳学习算法却是针对离散属性空间的.因此,对数据进行预处理的离散化算法一直受到人们的重视.兼顾所有属性间关系的整体离散化是一个重要方法,该文提出基于数据分区的整体离散化算法,它首先对例子集合在各个连续属性上的取值进行统一的放大处理,选出包含最多聚类信息的属性,将整个例子集合粗略的划分为多个分区;然后在各个分区中分别进行聚类、合并.该方法改进了基本的整体离散化算法,并利用农业专家系统中的土壤分类数据对算法进行了验证.
推荐文章
基于信息熵理论的连续属性离散化方法
离散化
数据挖掘
信息熵
连续属性离散化算法比较研究
离散化
贪心算法
属性重要性
信息熵
聚类
基于对象分布的连续属性离散化方法
信息系统
模糊聚类
概率统计
连续属性
离散化
基于词出现和信息增益的连续属性离散化方法
连续属性的离散化
信息增益
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于数据分区的连续属性整体离散化方法研究
来源期刊 杭州电子科技大学学报(自然科学版) 学科
关键词 归纳学习 离散化 数据分区 整体离散化
年,卷(期) 2006,(1) 所属期刊栏目
研究方向 页码范围 18-21
页数 4页 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1001-9146.2006.01.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵建锋 浙江工业大学之江学院 12 38 3.0 6.0
2 吕圣军 浙江工业大学之江学院 9 14 3.0 3.0
3 王定国 浙江工业大学之江学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (128)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1978(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(1)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
归纳学习
离散化
数据分区
整体离散化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
杭州电子科技大学学报(自然科学版)
双月刊
1001-9146
33-1339/TN
chi
出版文献量(篇)
3184
总下载数(次)
0
总被引数(次)
11145
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导