基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文主要对文本自动分类的特征选择方法进行了讨论,分析了几种常见方法存在的缺陷,指出影响出文本特征选择的两个重要因素--特征项在类别内的文档频率和在类别间的分布差异,并以这两个因素为影响因子分别对TF-IDF和IG方法进行了改进。另外还介绍了朴素贝叶斯分类模型,并基于此模型对改进的特征选择方法的分类效果进行评估。实验结果表明,改进后的方法能够强化特征项在特定类别中的影响力,提高文本分类效果。
推荐文章
基于引力模型的朴素贝叶斯分类算法
分类算法
朴素贝叶斯
引力模型
遥感图像
基于改进特征加权的朴素贝叶斯分类算法
文本分类
朴素贝叶斯
JS散度
词频
文本频率
类别频率
基于改进的朴素贝叶斯文本分类研究
文本分类
朴素贝叶斯
K近邻
知网
中文分词
基于 MapReduce 的平均多项朴素贝叶斯文本分类
文本分类
朴素贝叶斯
并行计算
冗余特征
大数据
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于朴素贝叶斯分类模型的文本特征选择研究
来源期刊 电脑知识与技术:学术交流 学科 工学
关键词 文本分类 特征选择
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 133-137
页数 5页 分类号 TP311
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周军 3 2 1.0 1.0
2 潘光强 2 1 1.0 1.0
3 何洋 2 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (42)
共引文献  (0)
参考文献  (13)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1995(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
特征选择
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电脑知识与技术:学术版
旬刊
1009-3044
34-1205/TP
安徽合肥市濉溪路333号
26-188
出版文献量(篇)
41621
总下载数(次)
23
总被引数(次)
0
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导