基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
朴素贝叶斯方法是一种高效的分类算法,但在处理海量数据时由于内存和I/O等资源的局限,该算法的效率受到极大影响.文中针对朴素贝叶斯分类算法特点,给出了基于MapReduce编程模型的实现朴素贝叶斯分类算法的方法.训练集内文件被分割进行处理,核心处理过程由MapReduce完成,Map函数完成对训练文件的解析,Reduce函数完成类别属性和特征属性知识库的构建.实验主要比较了传统算法和改进并行算法的性能,结果表明:在大数据量的情况下使用Ma-pReduce并行化的朴素贝叶斯算法具有良好的执行效率与较高的扩展性.
推荐文章
分布式朴素贝叶斯算法在文本分类中的应用
MapReduce框架
文本分类
朴素贝叶斯算法
检测僵尸网络的贝叶斯算法的MapReduce 并行化实现
僵尸网络
检测僵尸网络
贝叶斯算法
Hadoop
MapReduce
流量
基于 MapReduce 的平均多项朴素贝叶斯文本分类
文本分类
朴素贝叶斯
并行计算
冗余特征
大数据
改进贝叶斯分类算法的MapReduce并行调度算法
贝叶斯分类算法
MapReduce
地震资料处理
并行调度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 朴素贝叶斯算法的MapReduce并行化分析与实现
来源期刊 计算机技术与发展 学科 工学
关键词 朴素贝叶斯分类算法 并行计算 MapReduce
年,卷(期) 2013,(3) 所属期刊栏目
研究方向 页码范围 23-26
页数 分类号 TP31
字数 3733字 语种 中文
DOI 10.3969/j.issn.1673-629X.2013.03.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 向阳 同济大学计算机科学与技术系 88 1316 16.0 34.0
2 张波 上海师范大学信息与机电工程学院 28 148 7.0 11.0
3 蒋锐权 3 42 3.0 3.0
4 张君瑛 2 43 2.0 2.0
5 张依杨 同济大学计算机科学与技术系 1 20 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (20)
同被引文献  (35)
二级引证文献  (44)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(8)
  • 引证文献(5)
  • 二级引证文献(3)
2016(10)
  • 引证文献(5)
  • 二级引证文献(5)
2017(8)
  • 引证文献(1)
  • 二级引证文献(7)
2018(14)
  • 引证文献(4)
  • 二级引证文献(10)
2019(18)
  • 引证文献(2)
  • 二级引证文献(16)
2020(3)
  • 引证文献(0)
  • 二级引证文献(3)
研究主题发展历程
节点文献
朴素贝叶斯分类算法
并行计算
MapReduce
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导