基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Web日志挖掘是为网站经营和策略调整提供数据支持的重要手段,但原始的日志数据往往杂乱不完整,非结构化,因此预处理结果的好坏极大影响到挖掘的质量,通过对预处理过程中几个主要步骤进行深入讨论,总结已有的各种处理手段并提出新的改进方法.针对现有预处理方法的局限和不足,对分析网页内嵌元素尤其是图像元素进行了深入研究,提出了相应的处理手段.
推荐文章
Web日志挖掘的预处理及路径补全算法的研究
Web日志挖掘
数据预处理
路径补全
算法
Web日志数据挖掘的数据预处理方法研究
Web用户访问日志数据挖掘
数据预处理方法
Web日志挖掘中预处理过程的具体研究
数据预处理
Web挖掘
用户识别
路径补充
Web日志数据挖掘中数据预处理模型的研究与建立
Web日志挖掘
数据挖掘
数据预处理
用户标识
会话标识
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web日志挖掘预处理研究
来源期刊 北京机械工业学院学报(综合版) 学科 工学
关键词 Web日志挖掘 焦点 会话 事务
年,卷(期) 2005,(4) 所属期刊栏目
研究方向 页码范围 28-31
页数 4页 分类号 TP311
字数 4305字 语种 中文
DOI 10.3969/j.issn.1674-6864.2005.04.008
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周长胜 北京机械工业学院计算机及自动化系 13 188 6.0 13.0
2 孔昊 北京机械工业学院计算机及自动化系 2 22 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (33)
参考文献  (3)
节点文献
引证文献  (22)
同被引文献  (13)
二级引证文献  (13)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(2)
  • 引证文献(2)
  • 二级引证文献(0)
2007(5)
  • 引证文献(5)
  • 二级引证文献(0)
2008(4)
  • 引证文献(4)
  • 二级引证文献(0)
2009(6)
  • 引证文献(4)
  • 二级引证文献(2)
2010(2)
  • 引证文献(1)
  • 二级引证文献(1)
2011(7)
  • 引证文献(3)
  • 二级引证文献(4)
2012(4)
  • 引证文献(0)
  • 二级引证文献(4)
2013(4)
  • 引证文献(3)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Web日志挖掘
焦点
会话
事务
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京信息科技大学学报(自然科学版)
双月刊
1674-6864
11-5866/N
大16开
北京市
1986
chi
出版文献量(篇)
2043
总下载数(次)
10
总被引数(次)
11074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导