基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为解决传统数据仓库扩展能力弱,不支持非结构化数据的问题,江苏有线结合实际应用情况,基于SQL-on-Hadoop技术实现了分布式的广电数据仓库TRAF.TRAF融合了传统数据仓库与Hadoop技术,可以同时存储结构化和非结构化数据,具备良好的扩展能力.TRAF在HBase框架之上构建支持多重查询嵌套和多级索引ANSI SQL标准的查询接口,实现海量用户行为的实时分析;采用通用x86服务器替代原有小型机存储,大幅降低了系统构建成本.测试结果表明,数据量在10亿条时,TRAF的处理速度比传统关系型数据仓库提升了5倍,同时构建成本降低了50%,有效提升了广电数据分析系统的应用水平.
推荐文章
基于分布式系统概念的分布式数据仓库
分布式数据仓库
节点仓库
分布式系统
数据集市
节点主题处理原则
分布式商业数据仓库技术的研究
数据仓库
分布式
决策支持
基于分布式数据仓库的分类分析研究
数据挖掘
分布式数据仓库
分类分析
GAC-RDB
Hadoop
HBase
Hive
基于Web的分布式数据仓库体系结构的研究
Web
分布式数据仓库
体系结构
XML
智能Agent
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于SQL-on-Hadoop的分布式广电数据仓库的设计与实现
来源期刊 有线电视技术 学科
关键词 数据仓库 分布式文件系统 SQL-on-Hadoop HBase 可扩展性
年,卷(期) 2017,(10) 所属期刊栏目 运营商平台搭建
研究方向 页码范围 42-47
页数 6页 分类号
字数 6671字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 高晓俊 11 3 1.0 1.0
2 朱琛刚 5 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据仓库
分布式文件系统
SQL-on-Hadoop
HBase
可扩展性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
有线电视技术
月刊
1008-5351
11-4021/TN
北京市2144信箱
chi
出版文献量(篇)
10278
总下载数(次)
7
总被引数(次)
11175
论文1v1指导