基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词索引,并提供实时检索,实现对海量文本数据的分布式并行处理.实验结果表明,Hadoop框架为大规模数据的分布式并行处理提供了很好的解决方案.
推荐文章
云计算Hadoop平台的异常数据检测算法研究
云计算
大数据
异常数据
Hadoop平台
基于HADOOP平台的云GIS构架研究
云GIS架构
HADOOP平台
云计算
分布式
基于云平台的海量图像分类算法研究
海量图像
分类器设计
云平台
图像内容信息
Gabor滤波器
图像分类
Hadoop云平台下的基于用户协同过滤算法研究
推荐系统
大数据
并行计算
协同过滤
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop云计算平台的海量文本处理研究
来源期刊 无线电通信技术 学科 工学
关键词 海量文本处理 Hadoop HDFS HBase MapReduce 分布式并行处理
年,卷(期) 2014,(1) 所属期刊栏目 综合电子信息技术
研究方向 页码范围 54-57
页数 4页 分类号 TP319
字数 3196字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈勇 中国电子科技集团公司第五十四研究所 35 123 8.0 9.0
2 陈金勇 中国电子科技集团公司第五十四研究所 41 136 6.0 9.0
3 张学亮 中国电子科技集团公司第五十四研究所 3 16 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (112)
参考文献  (7)
节点文献
引证文献  (12)
同被引文献  (53)
二级引证文献  (35)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(4)
  • 参考文献(3)
  • 二级参考文献(1)
2012(4)
  • 参考文献(3)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(9)
  • 引证文献(6)
  • 二级引证文献(3)
2017(6)
  • 引证文献(1)
  • 二级引证文献(5)
2018(10)
  • 引证文献(1)
  • 二级引证文献(9)
2019(13)
  • 引证文献(1)
  • 二级引证文献(12)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
海量文本处理
Hadoop
HDFS
HBase
MapReduce
分布式并行处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线电通信技术
双月刊
1003-3114
13-1099/TN
大16开
河北省石家庄市中山西路589号
18-149
1972
chi
出版文献量(篇)
2815
总下载数(次)
6
总被引数(次)
11314
论文1v1指导