基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
采用朴素贝叶斯算法作为文本分类算法时,因其每个特征出现概率相互独立且每个特征重要程度相等的假设,所以选择一种高效的特征选择方法显得尤为重要。本文运用jieba中文分词模块的TF-IDF标准[1]对训练新闻文本进行特征选择,实现一个基于朴素贝叶斯的文本分类模型。对待分类新闻文本也同样用该TF-IDF标准来提取文本关键词再进行分类测试,实验测试结果表明有相当高的分类效率。
推荐文章
朴素贝叶斯算法和SVM算法在Web文本分类中的效率分析
Web分类系统
朴素贝叶斯算法
SVM算法
效率分析
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
文本分类
云计算
MapReduce
朴素贝叶斯文本
数据平滑
基于 MapReduce 的平均多项朴素贝叶斯文本分类
文本分类
朴素贝叶斯
并行计算
冗余特征
大数据
基于改进的朴素贝叶斯文本分类研究
文本分类
朴素贝叶斯
K近邻
知网
中文分词
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高效朴素贝叶斯Web新闻文本分类模型的简易实现
来源期刊 统计学与应用 学科 工学
关键词 文本分类 特征选择 朴素贝叶斯 TF-IDF标准
年,卷(期) 2014,(1) 所属期刊栏目
研究方向 页码范围 30-35
页数 6页 分类号 TP39
字数 语种
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈丽 广东工业大学管理学院 76 209 7.0 10.0
2 刘洪伟 广东工业大学管理学院 51 250 9.0 14.0
3 吴致晖 广东工业大学管理学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
特征选择
朴素贝叶斯
TF-IDF标准
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
统计学与应用
双月刊
2325-2251
武汉市江夏区汤逊湖北路38号光谷总部空间
出版文献量(篇)
512
总下载数(次)
3
论文1v1指导