基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对海量文本数据处理,为实现快速文本处理响应,缩短海量数据为辅助决策提供服务的时间,基于Hadoop云计算平台,建立HDFS分布式文件系统存储海量文本数据集,通过文本词频利用MapReduce原理建立分布式索引,以分布式数据库HBase存储关键词索引,并提供实时检索,实现对海量文本数据的分布式并行处理.实验结果表明,Hadoop框架为大规模数据的分布式并行处理提供了很好的解决方案.
推荐文章
基于Hadoop的云计算平台研究与实现
Hadoop
HDFS
MapReduce
云计算
基于Hadoop云计算平台的车牌识别
Hadoop
云计算
车牌识别
MapReduce
基于Hadoop高校教育资源云存储平台构建研究
云计算
Hadoop
云存储
分布式文件系统
教育资源
通用文本处理方法的研究与设计
文本处理
正则表达式
脚本语言
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop云计算平台的海量文本处理研究
来源期刊 无线电通信技术 学科 工学
关键词 海量文本处理 Hadoop HDFS HBase MapReduce 分布式并行处理
年,卷(期) 2014,(1) 所属期刊栏目 综合电子信息技术
研究方向 页码范围 54-57
页数 4页 分类号 TP319
字数 3196字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈勇 中国电子科技集团公司第五十四研究所 35 123 8.0 9.0
2 陈金勇 中国电子科技集团公司第五十四研究所 41 136 6.0 9.0
3 张学亮 中国电子科技集团公司第五十四研究所 3 16 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (33)
共引文献  (112)
参考文献  (7)
节点文献
引证文献  (12)
同被引文献  (53)
二级引证文献  (35)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(6)
  • 参考文献(1)
  • 二级参考文献(5)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(4)
  • 参考文献(3)
  • 二级参考文献(1)
2012(4)
  • 参考文献(3)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(9)
  • 引证文献(6)
  • 二级引证文献(3)
2017(6)
  • 引证文献(1)
  • 二级引证文献(5)
2018(10)
  • 引证文献(1)
  • 二级引证文献(9)
2019(13)
  • 引证文献(1)
  • 二级引证文献(12)
2020(6)
  • 引证文献(0)
  • 二级引证文献(6)
研究主题发展历程
节点文献
海量文本处理
Hadoop
HDFS
HBase
MapReduce
分布式并行处理
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线电通信技术
双月刊
1003-3114
13-1099/TN
大16开
河北省石家庄市中山西路589号
18-149
1972
chi
出版文献量(篇)
2815
总下载数(次)
6
总被引数(次)
11314
论文1v1指导