原文服务方: 科技与创新       
摘要:
本文研究使用粗糙集对文本分类的方法,提出一种双重特征选取的特征项选取方法,该方法将加权后的TF-IDF和CHI两种方法相结合,取它们的交集,这样可以过滤掉一些代表性较弱的特征词,另外本文对基于区分矩阵核的启发式约简算法做了改进,加入了一个代表性强的特征词集,以保证重要的特征词不被约简掉.实验表明使用双重特征选取和改进后的启发式约简所得的分类效果良好.
推荐文章
一种基于粗糙集理论的启发式分类规则挖掘算法
粗糙集
分类正确度
属性依赖度
约简
分类
考虑用户偏好的启发式约简算法
用户偏好
粗糙集
属性约简
粗糙集属性约简方法研究
属性约简
粗糙集
遗传算法
蚁群算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 双重选词和启发式约简的粗糙集文本分类
来源期刊 科技与创新 学科
关键词 文本分类 粗糙集 双重特征提取 特征词集
年,卷(期) 2009,(30) 所属期刊栏目 软件时空
研究方向 页码范围 167-168,166
页数 3页 分类号 TP391|TP18
字数 语种 中文
DOI 10.3969/j.issn.2095-6835.2009.30.069
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (77)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
粗糙集
双重特征提取
特征词集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
论文1v1指导