基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
传统的关联文本分类算法产生的规则数量巨大,若不对规则剪枝会影响分类效率,而采用以前的剪枝方法又会使分类精度出现不同程度的下降.为此提出以互信息的方法对每个类的规则进行剪枝,挑选出分类能力强的规则构成分类器.对待分类文本进行分类.经过这个方法剪枝后的规则数量大幅减少,且能取得比规则集未修剪过的分类器和采用以前剪枝方法的ARC-BC算法更好的分类效果,大量的实验表明此方法是有效的.
推荐文章
文本分类中改进型互信息特征选择的研究
文本分类
特征选择
互信息
分类精度
影响因素
一种基于反向文本频率互信息的文本挖掘算法研究
文本挖掘
互信息
向量空间模型
权重
基于权重差异和类别关联的互信息改进研究
特征选择
互信息
权重差异
类别关联
基于GA和信息熵的文本分类规则抽取方法
文本分类
遗传算法
信息熵
文本挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于互信息规则剪枝的关联文本分类
来源期刊 南京师范大学学报(工程技术版) 学科 工学
关键词 互信息 规则剪枝 关联分类
年,卷(期) 2008,(4) 所属期刊栏目
研究方向 页码范围 173-177
页数 5页 分类号 TP18
字数 4536字 语种 中文
DOI 10.3969/j.issn.1672-1292.2008.04.041
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 白清源 福州大学数学与计算机科学学院 22 108 7.0 9.0
2 商炳章 福州大学数学与计算机科学学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (17)
参考文献  (2)
节点文献
引证文献  (1)
同被引文献  (1)
二级引证文献  (3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
互信息
规则剪枝
关联分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南京师范大学学报(工程技术版)
季刊
1672-1292
32-1684/T
大16开
南京市宁海路122号
2001
chi
出版文献量(篇)
1491
总下载数(次)
3
总被引数(次)
7734
相关基金
教育部留学回国人员科研启动基金
英文译名:the Scientific Research Foundation for the Returned Overseas Chinese Scholars, State Education Ministry
官方网址:http://www.csc.edu.cn/gb/
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导