基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络用户随时间变化的行为分析是近年来用户行为分析的热点,通常为了发现用户行为的特征需要对用户做聚类处理.针对用户时序数据的聚类问题,现有研究方法存在计算性能差,距离度量不准确的缺点,无法处理大规模数据.为了解决上述问题,该文提出基于对称KL距离的用户行为时序聚类方法.首先将时序数据转化为概率模型,从划分聚类的角度出发,在距离度量中引入KL距离,用以衡量不同用户间的时间分布差异.针对实网数据中数据规模大的特点,该方法在聚类的各个环节针对KL距离的特点做了优化,并证明了一种高效率的聚类质心求解办法.实验结果证明,该算法相比采用欧式距离和DTW距离度量的聚类算法能提高4%的准确度,与采用medoids聚类质心的聚类算法相比计算时间少了一个量级.采用该算法对实网环境中获取的用户流量数据处理证明了该算法拥有可行的应用价值.
推荐文章
基于分段、聚类和时序关联分析的用户行为分析
分段
最大距离聚类
Apriori算法
基于对称KL距离的自适应粒子滤波算法
粒子滤波
自适应滤波
信息距离
KL距离
一种新型的基于Levenshtein距离层次聚类的时序操作优化方法
时间序列
Levenshtein距离
层次聚类
操作优化
精馏
基于行为时序逻辑的入侵取证研究
入侵取证
行为时序逻辑
逻辑描述语言
系统验证
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于对称KL距离的用户行为时序聚类方法
来源期刊 电子与信息学报 学科 工学
关键词 时序聚类 用户分析 Kullback-Leibler距离
年,卷(期) 2018,(10) 所属期刊栏目 论文
研究方向 页码范围 2365-2372
页数 8页 分类号 TN915.07
字数 6532字 语种 中文
DOI 10.11999/JEIT180016
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李文璟 北京邮电大学网络与交换技术国家重点实验室 39 149 7.0 9.0
2 喻鹏 北京邮电大学网络与交换技术国家重点实验室 20 54 4.0 6.0
3 曾祥健 北京邮电大学网络与交换技术国家重点实验室 2 6 2.0 2.0
4 李梦 北京邮电大学网络与交换技术国家重点实验室 3 6 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (25)
共引文献  (51)
参考文献  (11)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1898(1)
  • 参考文献(0)
  • 二级参考文献(1)
1929(1)
  • 参考文献(0)
  • 二级参考文献(1)
1951(1)
  • 参考文献(1)
  • 二级参考文献(0)
1963(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(1)
  • 二级参考文献(0)
1987(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2015(4)
  • 参考文献(1)
  • 二级参考文献(3)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
2017(4)
  • 参考文献(3)
  • 二级参考文献(1)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
时序聚类
用户分析
Kullback-Leibler距离
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
总被引数(次)
95911
论文1v1指导