作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在Hadoop云计算的大数据应用中,点击日志数据的挖掘处理是一项重要工作,日志收集服务器每天上传大量的点击日志信息,这些点击日志信息是从事电子商务企业了解用户心理倾向的关键信息,日志分析和挖掘对于企业越来越重要,直接和企业的发展和效益密不可分.对于结构化的日志,Hadoop Hive的HQL即可实现日志的数据清洗,而对于非结构化的点击流日志,HQL就显得捉襟见肘,文章就使用MapReduce实现点击日志信息的数据清洗处理进行简述,同时列举了实例供大家参考.
推荐文章
基于点击流数据仓库的用户行为分析
点击流
数据仓库
Web服务器日志
SQLServer2005
联机分析处理
基于数据仓库的工作流日志更新
工作流挖掘
工作流日志
数据仓库
数据更新
基于Hadoop的网络日志挖掘方案的设计
网络日志
数据挖掘
数据清洗
Hadoop
MySQL
支持 Hadoop大数据访问的pNFS框架研究与实现
分布式文件系统
大数据
缓存
布局
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Hadoop实现点击流日志的数据清洗
来源期刊 无线互联科技 学科
关键词 HiveQL 数据库 MapReduce 粒度管理器
年,卷(期) 2018,(9) 所属期刊栏目 软件透视
研究方向 页码范围 51-53
页数 3页 分类号
字数 905字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵鑫 辽宁行政学院人事处 40 37 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (2)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (4)
二级引证文献  (0)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
HiveQL
数据库
MapReduce
粒度管理器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
无线互联科技
半月刊
1672-6944
32-1675/TN
16开
江苏省南京市
2004
chi
出版文献量(篇)
18145
总下载数(次)
78
总被引数(次)
27320
论文1v1指导