基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
云计算的诞生,有效地解决了海量数据集的存储和分析处理.在云计算实现的开源Hadoop分布式系统集群上,使用MapReduce并行编程模型,设计并实现了一种对TFIDF改进的分布式朴素贝叶斯文本分类算法.实验结果表明,基于Hadoop框架的分布式朴素贝叶斯文本自动分类器不仅能处理节点失效,同时具有高效性和易扩展性的优势.
推荐文章
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
文本分类
云计算
MapReduce
朴素贝叶斯文本
数据平滑
基于改进的朴素贝叶斯文本分类研究
文本分类
朴素贝叶斯
K近邻
知网
中文分词
基于 MapReduce 的平均多项朴素贝叶斯文本分类
文本分类
朴素贝叶斯
并行计算
冗余特征
大数据
基于Hadoop的Dirichlet朴素贝叶斯文本分类算法
文本分类
云计算
MapReduce
朴素贝叶斯文本
数据平滑
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的分布式朴素贝叶斯文本分类
来源期刊 计算机系统应用 学科 工学
关键词 Hadoop 朴素贝叶斯 MapReduce 文本分类
年,卷(期) 2012,(2) 所属期刊栏目 经验交流
研究方向 页码范围 210-213
页数 分类号 TP391.1
字数 3959字 语种 中文
DOI 10.3969/j.issn.1003-3254.2012.02.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 石洪波 山西财经大学信息管理学院 45 446 11.0 19.0
2 冀素琴 山西财经大学信息管理学院 13 118 6.0 10.0
3 卫洁 山西财经大学信息管理学院 4 47 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (97)
参考文献  (2)
节点文献
引证文献  (29)
同被引文献  (33)
二级引证文献  (84)
1975(2)
  • 参考文献(1)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(12)
  • 引证文献(7)
  • 二级引证文献(5)
2016(16)
  • 引证文献(8)
  • 二级引证文献(8)
2017(25)
  • 引证文献(4)
  • 二级引证文献(21)
2018(24)
  • 引证文献(5)
  • 二级引证文献(19)
2019(29)
  • 引证文献(1)
  • 二级引证文献(28)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
Hadoop
朴素贝叶斯
MapReduce
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导