基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络日志包含了大量有价值的信息,对分析用户上网行为模式提供有力数据保障.而随着互联网及应用程序规模的不断扩大,各种日志信息同时也呈数量级的增长,一般使用单台机器处理的用户行为分析系统早已无法满足当前需求.Spark作为一个专为大规模数据处理而设计的快速通用的分布式计算引擎,具有易用性、通用性和更快的速度等优势.本文介绍了现有常用的数据挖掘技术及Spark机器学习库MLlib中的相关算法,设计了一个基于Spark平台并使用多种MLlib挖掘算法的用户行为分析系统融合框架,包括日志采集、日志预处理、用户聚类、关联规则、序列模式、可视化、任务管理等模块.
推荐文章
基于Spark的移动用户行为 轨迹大数据分析
移动用户行为
轨迹分析
分布式处理
Spark
基于Spark的用户上网WAP日志分析
大数据
分布式
Hadoop
Spark
基于Spark GraphX和社交网络大数据的用户影响力分析
数据挖掘
社交网络大数据
Spark GraphX
用户影响力分析
一种改进的基于Spark的用户行为分析方法的研究
Spark
Apriori
互联网
数据分析
网络用户行为分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Spark的用户行为分析系统框架研究
来源期刊 网络安全技术与应用 学科
关键词 Spark MLlib 数据挖掘 用户行为分析
年,卷(期) 2018,(2) 所属期刊栏目 安全模型、算法与编程
研究方向 页码范围 56-57
页数 2页 分类号
字数 3198字 语种 中文
DOI 10.3969/j.issn.1009-6833.2018.02.034
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姚远 16 78 5.0 8.0
2 刘辰 2 4 1.0 2.0
3 殷乐 2 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (52)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (3)
二级引证文献  (0)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(5)
  • 参考文献(5)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
Spark
MLlib
数据挖掘
用户行为分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
网络安全技术与应用
月刊
1009-6833
11-4522/TP
大16开
北京市
2-741
2001
chi
出版文献量(篇)
13340
总下载数(次)
61
总被引数(次)
33730
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导