基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出了基于web拓扑结构和访问页面兴趣度动态确定时间间隔的算法,将其应用到网络日志数据预处理研究中的会话识别阶段.以反向代理服务器采集的网络日志作为数据来源进行实验,结果表明该算法同其他会话识别算法相比,在精确度和完整度上有了很大的提高;能够有效保留用户访问校内网的日志数据特征,为后面完成推荐或者决策提供一个良好的基础.
推荐文章
基于网络日志挖掘技术数据信息分析的研究
日志挖掘
数据分析
信息检索
网络日志
基于大数据技术的网络日志分析系统研究
大数据
日志采集
MapReduce
日志分析
IP统计
Web日志挖掘数据预处理过程技术研究
Web日志挖掘
数据预处理
用户识别
一种网络日志属性挖掘与分析方法
网络日志
日志属性
活跃期
地域属性
LDA模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络日志数据的预处理技术研究
来源期刊 云南师范大学学报(自然科学版) 学科 工学
关键词 校内网 日志数据 数据预处理 会话识别
年,卷(期) 2018,(4) 所属期刊栏目 计算机科学及应用
研究方向 页码范围 27-30
页数 4页 分类号 TP311
字数 3399字 语种 中文
DOI 10.7699/j.ynnu.ns-2018-046
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 梁立 云南师范大学信息学院信息管理处 75 313 10.0 15.0
2 陈建兵 云南师范大学信息学院信息管理处 13 20 3.0 4.0
3 陈晗阳 云南师范大学信息学院信息管理处 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (19)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (4)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2015(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
校内网
日志数据
数据预处理
会话识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
云南师范大学学报(自然科学版)
双月刊
1007-9793
53-1046/N
大16开
云南昆明市一二一大街298号
64-74
1958
chi
出版文献量(篇)
2229
总下载数(次)
5
总被引数(次)
10561
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导