基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着Internet的发展及广泛应用,越来越多的文本信息以待阅读和处理.文本分类成为众所关注但仍未很好解决的热门课题.本文提出一种基于粗糙集和模糊聚类(RS&FC)理论的文本分类新模型, 详细讨论和分析了该模型的总体设计思想、主要实现技术和有关的算法及实现方案.该模型在分类规则产生之前,以训练样本直接聚类的结果构造信息表,并对表中的连续属性离散化,再对信息表中的特征词属性进行二次聚类,压缩文本特征子集的向量维数,提取关键字特征属性,建立决策信息表,然后利用粗糙集理论,采用启发式约简算法,对信息表进行约简,产生优化的分类规则,指导文本分类.最后通过实验和性能评价,本文提出的分类方法的分类准确率高于传统的K-最近邻分类(K-NN)法,提高了系统的适应性能和分类能力.
推荐文章
利用聚类和粗糙集进行文本分类研究
文本分类 空间向量模型(VSM) 聚类 粗糙集理论 条件熵
基于粗糙集的多标签文本分类算法
多标签
粗糙集
约简
分类规则
匹配
基于模糊粗糙集的Web文本分类
机器学习
模糊粗糙集
Web文本分类
属性约简
一种基于Canopy和粗糙集的CRS-KNN文本分类算法
Canopy聚类
粗糙集
K-最近邻(KNN)算法
文本分类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于粗糙集和模糊聚类理论的文本分类系统的研究与实现
来源期刊 铁道学报 学科 工学
关键词 粗糙集 模糊聚类 文本分类 文本聚类 规则约简
年,卷(期) 2007,(1) 所属期刊栏目
研究方向 页码范围 45-49
页数 5页 分类号 TP391.1
字数 3798字 语种 中文
DOI 10.3321/j.issn:1001-8360.2007.01.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑丽英 兰州交通大学电子与信息工程学院 63 426 12.0 17.0
5 王海涌 兰州交通大学电子与信息工程学院 30 313 11.0 16.0
9 刘丽艳 兰州交通大学电子与信息工程学院 8 132 5.0 8.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (3)
共引文献  (6)
参考文献  (2)
节点文献
引证文献  (13)
同被引文献  (23)
二级引证文献  (124)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2007(1)
  • 引证文献(1)
  • 二级引证文献(0)
2008(3)
  • 引证文献(3)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(4)
  • 引证文献(1)
  • 二级引证文献(3)
2011(9)
  • 引证文献(2)
  • 二级引证文献(7)
2012(9)
  • 引证文献(1)
  • 二级引证文献(8)
2013(5)
  • 引证文献(0)
  • 二级引证文献(5)
2014(20)
  • 引证文献(0)
  • 二级引证文献(20)
2015(7)
  • 引证文献(1)
  • 二级引证文献(6)
2016(7)
  • 引证文献(0)
  • 二级引证文献(7)
2017(15)
  • 引证文献(1)
  • 二级引证文献(14)
2018(23)
  • 引证文献(1)
  • 二级引证文献(22)
2019(20)
  • 引证文献(0)
  • 二级引证文献(20)
2020(12)
  • 引证文献(0)
  • 二级引证文献(12)
研究主题发展历程
节点文献
粗糙集
模糊聚类
文本分类
文本聚类
规则约简
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
铁道学报
月刊
1001-8360
11-2104/U
大16开
北京复兴路10号
2-308
1979
chi
出版文献量(篇)
4684
总下载数(次)
8
总被引数(次)
85544
相关基金
甘肃省自然科学基金
英文译名:Natural Science Foundation of Gansu Province
官方网址:http://www.nwnu.edu.cn/kjc/glbf/gsshzrkxjjzxglbf.htm
项目类型:
学科类型:
论文1v1指导