作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着互联网及大数据时代的到来,新数据的产生以指数级的速度增长,而这大量的数据中,又以格式不确定的非结构化数据为主.主流的关系型数据库技术很难驾驭非结构化数据,本文提出基于Hadoop分布式框架的非结构化数据管理体系.采用HBase数据库技术处理多格式的大量小文件,利用Lucene检索引擎设计全文检索策略,并在此基础上搭建分层体系架构.
推荐文章
电网非结构化数据管理平台研究与实现
Hadoop
HDFS
NoSQL数据库
非结构化数据管理平台
用电信息采集系统非结构化数据管理设计
用电信息采集系统
非结构化数据
框架设计
海量数据
数据挖掘
基于Hadoop和Mahout的大数据管理分析系统
大数据
Hadoop
Mahout
数据分析
基于企业架构的非结构化数据管理平台建设研究
企业架构
非结构化
数据管理平台
业务过程
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Hadoop的非结构化数据管理在石油行业中的研究与实现
来源期刊 数字技术与应用 学科 工学
关键词 Hadoop 非结构化数据 Lucene
年,卷(期) 2017,(5) 所属期刊栏目 应用研究
研究方向 页码范围 54
页数 1页 分类号 TP311
字数 1343字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张学伟 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Hadoop
非结构化数据
Lucene
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字技术与应用
月刊
1007-9416
12-1369/TN
16开
天津市
6-251
1983
chi
出版文献量(篇)
20434
总下载数(次)
106
总被引数(次)
35701
论文1v1指导