基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
简单分析了词频方法和文档频方法,在总结其不足的基础上,提出了一个类别相关性方法,随后分析了ID3中信息增益的缺点并引进属性依赖度来加以改进,并进一步根据其中信息增益的计算特点,利用凸函数的性质来进行简化,减少了信息增益的计算量,提高了信息增益的计算效率;最后将此优化的ID3同类别相关性方法结合起来,提出了一个综合的特征选择方法.该综合方法首先使用类别相关性方法进行特征初选以降低文本向量的稀疏性,然后再使用优化的ID3来进一步选择特征,从而获得较具代表性的特征子集.实验结果表明该方法性能良好.
推荐文章
基于词频类别相关的特征权重算法
文本分类
文本表示
特征权重
文档频率
逆类频率
基于一种新的属性选择标准的ID3改进算法
简化
ID3算法
重要度
数据挖掘软件
决策树ID3新属性选择方法
数据挖掘
决策树
粗糙集
ID3算法
大数据
算法改进
基于类别相关性和交叉熵的特征选择方法
文本分类
特征选择
类别相关性
交叉熵
属性约简
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于类别相关性和优化的ID3特征选择
来源期刊 数据采集与处理 学科 工学
关键词 文本分类 信息增益 属性依赖度
年,卷(期) 2011,(2) 所属期刊栏目 研究简报
研究方向 页码范围 230-234
页数 分类号 TP301
字数 4858字 语种 中文
DOI 10.3969/j.issn.1004-9037.2011.02.020
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 朱颢东 郑州轻工业学院计算机与通信工程学院 70 367 11.0 13.0
2 史岳鹏 郑州牧业工程高等专科学校信息工程系 16 40 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (36)
共引文献  (208)
参考文献  (11)
节点文献
引证文献  (4)
同被引文献  (16)
二级引证文献  (80)
1986(4)
  • 参考文献(1)
  • 二级参考文献(3)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(5)
  • 参考文献(0)
  • 二级参考文献(5)
1998(5)
  • 参考文献(1)
  • 二级参考文献(4)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(6)
  • 参考文献(3)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(8)
  • 引证文献(1)
  • 二级引证文献(7)
2016(19)
  • 引证文献(0)
  • 二级引证文献(19)
2017(14)
  • 引证文献(0)
  • 二级引证文献(14)
2018(23)
  • 引证文献(0)
  • 二级引证文献(23)
2019(10)
  • 引证文献(0)
  • 二级引证文献(10)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
文本分类
信息增益
属性依赖度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据采集与处理
双月刊
1004-9037
32-1367/TN
大16开
南京市御道街29号1016信箱
28-235
1986
chi
出版文献量(篇)
3235
总下载数(次)
7
总被引数(次)
25271
论文1v1指导