基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于频繁模式的关联分类是近年来出现的一种分类方法,该方法利用各类别频繁出现的模式构造分类规则,并对新文本进行分类.但现有关联分类方法应用于文本分类时存在两方面不足:一方面,用以构造分类规则的频繁模式仅考虑特征词在文本中出现与否,从而忽视了出现频度;另一方面,当产生的规则数量较多时,为提高分类效率需要进行规则修剪,修剪后的分类准确性明显降低.为此,提出了基于分类规则树的带词频的频繁模式文本分类方法.研究结果表明,词频的引入可以提高关联分类的准确率;而采用分类规则树可使分类时间明显加快又确保不降低分类质量.这两方面的措施弥补了现有关联分类应用于文本分类的不足.与3种典型文本分类方法比较后发现,在低维特征空间中,关联分类的性能优于Bayes,kNN(k nearest neighbor)和SVM(support vectormachines),因此是一种很有应用前景的文本分类方法.
推荐文章
基于GA和信息熵的文本分类规则抽取方法
文本分类
遗传算法
信息熵
文本挖掘
基于模糊分类规则树的文本分类
文本分类
模糊分类关联规则
分类规则树
模糊分类规则树
基于支持向量机的Web文本分类方法
支持向量机
特征提取
Web文本
文本分类
文本分类技术研究
文本分类
文本模型
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于分类规则树的频繁模式文本分类
来源期刊 软件学报 学科 工学
关键词 频繁模式 文本分类 词频 关联规则 分类规则
年,卷(期) 2006,(5) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 1017-1025
页数 9页 分类号 TP18
字数 6996字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡运发 复旦大学计算机与信息技术系 150 3430 27.0 54.0
2 李荣陆 复旦大学计算机与信息技术系 12 908 8.0 12.0
3 陈晓云 复旦大学计算机与信息技术系 76 590 13.0 21.0
7 王雷 复旦大学计算机与信息技术系 7 93 5.0 7.0
8 陈袆 复旦大学计算机与信息技术系 1 61 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (22)
参考文献  (2)
节点文献
引证文献  (61)
同被引文献  (72)
二级引证文献  (121)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2007(5)
  • 引证文献(5)
  • 二级引证文献(0)
2008(14)
  • 引证文献(13)
  • 二级引证文献(1)
2009(13)
  • 引证文献(5)
  • 二级引证文献(8)
2010(23)
  • 引证文献(4)
  • 二级引证文献(19)
2011(16)
  • 引证文献(2)
  • 二级引证文献(14)
2012(23)
  • 引证文献(9)
  • 二级引证文献(14)
2013(21)
  • 引证文献(6)
  • 二级引证文献(15)
2014(15)
  • 引证文献(4)
  • 二级引证文献(11)
2015(16)
  • 引证文献(2)
  • 二级引证文献(14)
2016(6)
  • 引证文献(2)
  • 二级引证文献(4)
2017(12)
  • 引证文献(3)
  • 二级引证文献(9)
2018(9)
  • 引证文献(3)
  • 二级引证文献(6)
2019(7)
  • 引证文献(2)
  • 二级引证文献(5)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
频繁模式
文本分类
词频
关联规则
分类规则
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导