基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种利用网页特征进行会话识别的方法.通过分析网页本身的特征,计算站点中所有网页的特征向量.根据这些特征向量,可以计算任意网页之间的相关程度.按照用户请求页面在日志中的时间顺序,可以得到日志中所有直接相邻的页面记录的关联程度曲线.通过设定一个阈值,在关联程度曲线中波动较大的位置形成会话边界.将关联程度大的页面分类到一个会话中,从而完成会话识别.
推荐文章
基于框架网页与页面阈值的会话识别算法
Web挖掘
数据预处理
阈值
Frame页面
会话识别
基于引用启发式和URL语义相结合的会话识别方法
Web日志挖掘
会话识别
数据预处理
引用启发式
URL语义
基于特征融合和机器学习的恶意网页识别研究
恶意网页
网页安全
网页特征
HTTP请求
机器学习
Web日志挖掘中改进的会话识别方法
会话识别
Web日志
数据预处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于网页特征的会话识别方法
来源期刊 燕山大学学报 学科 工学
关键词 Web日志挖掘 数据预处理 会话识别
年,卷(期) 2008,(1) 所属期刊栏目 信息与计算机技术
研究方向 页码范围 10-13
页数 4页 分类号 TP311
字数 3943字 语种 中文
DOI 10.3969/j.issn.1007-791X.2008.01.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 陈子军 燕山大学信息科学与工程学院 40 202 7.0 12.0
2 王鑫昱 燕山大学信息科学与工程学院 5 72 4.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (91)
参考文献  (7)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(1)
  • 二级参考文献(1)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
Web日志挖掘
数据预处理
会话识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
燕山大学学报
双月刊
1007-791X
13-1219/N
大16开
河北省秦皇岛市河北大街西段438号
18-73
1963
chi
出版文献量(篇)
2254
总下载数(次)
2
总被引数(次)
12529
论文1v1指导