基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
web日志中包含大量的冗余信息,这给挖掘带来了不便.数据预处理就是处理这些冗余信息,经过数据净化、用户识别、会话识别、路径补全操作后得到能够用于挖掘的数据.本文详细介绍了预处理过程,同时对传统的会话识别算法加以改进.本文提到的实际系统是基于SQL语句的,能够显著缩短预处理时间.
推荐文章
Web日志数据挖掘的数据预处理方法研究
Web用户访问日志数据挖掘
数据预处理方法
Web日志挖掘数据预处理过程技术研究
Web日志挖掘
数据预处理
用户识别
Web日志数据挖掘中数据预处理模型的研究与建立
Web日志挖掘
数据挖掘
数据预处理
用户标识
会话标识
Web日志挖掘中数据预处理的研究
数据挖掘
Web日志挖掘
数据预处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种改进的Web日志数据预处理研究
来源期刊 自动化技术与应用 学科 工学
关键词 Web日志挖掘 用户识别 会话识别 路径补全
年,卷(期) 2008,(3) 所属期刊栏目 计算机应用
研究方向 页码范围 23-25
页数 3页 分类号 TP368
字数 2632字 语种 中文
DOI 10.3969/j.issn.1003-7241.2008.03.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 孙名松 哈尔滨理工大学计算机科学与技术学院 55 355 12.0 15.0
2 唐亮 哈尔滨理工大学计算机科学与技术学院 5 68 5.0 5.0
3 王艳丽 哈尔滨理工大学计算机科学与技术学院 8 23 3.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (45)
参考文献  (5)
节点文献
引证文献  (8)
同被引文献  (13)
二级引证文献  (44)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(2)
  • 二级参考文献(0)
2006(3)
  • 参考文献(2)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(4)
  • 引证文献(3)
  • 二级引证文献(1)
2010(7)
  • 引证文献(4)
  • 二级引证文献(3)
2011(6)
  • 引证文献(0)
  • 二级引证文献(6)
2012(10)
  • 引证文献(1)
  • 二级引证文献(9)
2013(4)
  • 引证文献(0)
  • 二级引证文献(4)
2014(4)
  • 引证文献(0)
  • 二级引证文献(4)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(6)
  • 引证文献(0)
  • 二级引证文献(6)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
Web日志挖掘
用户识别
会话识别
路径补全
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化技术与应用
月刊
1003-7241
23-1474/TP
大16开
哈尔滨市开发区汉水路165号
14-37
1982
chi
出版文献量(篇)
8131
总下载数(次)
24
总被引数(次)
36824
相关基金
黑龙江省自然科学基金
英文译名:
官方网址:http://jj.dragon.cn/zr/index.asp
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导