基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对于连续频繁访问路径的挖掘如果采用常见的序列模式挖掘算法, 挖掘效率是比较低的, 而且只能得到频繁访问路径. 本文在研究访问路径性质的基础上给出了一种能从普通 Web 日志中挖掘出连续频繁访问路径的算法. 设计了一种新颖的数据结构压缩存储空间及存储所需挖掘信息. 同时采用分区搜索的方式, 为每个频繁节点构造一棵后缀树, 通过遍历该后缀树挖掘出连续频繁访问路径. 采用这种方法进行挖掘, 无需生成候选集, 而且一次就可以挖掘出所有以根节点为后缀的连续频繁访问路径.
推荐文章
基于访问路径树的Web频繁访问路径挖掘算法研究
频繁访问路径
访问路径树
扩展子路径
基于访问路径树的Web频繁访问路径挖掘算法研究
频繁访问路径
访问路径树
扩展子路径
基于最长前缀频繁子路径树的Web日志挖掘算法
Web日志挖掘
频繁访问路径
访问路径树
挖掘Web日志中连续可重复频繁访问路径的新算法
Web使用挖掘
连续可重复频繁访问路径
访问路径树
算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进的基于 Web 的频繁访问路径挖掘算法
来源期刊 测试技术学报 学科 工学
关键词 连续频繁访问路径 网络服务器日志 分区搜索 后缀树 频繁节点
年,卷(期) 2009,(3) 所属期刊栏目 信号检测、算法与仿真
研究方向 页码范围 244-247
页数 4页 分类号 TP274
字数 3840字 语种 中文
DOI 10.3969/j.issn.1671-7449.2009.03.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 庞敏 中北大学电子与计算机科学技术学院 8 37 2.0 6.0
2 周海英 中北大学电子与计算机科学技术学院 35 124 6.0 8.0
3 赵乙国 中北大学信息与通信工程学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (24)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (6)
二级引证文献  (1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
连续频繁访问路径
网络服务器日志
分区搜索
后缀树
频繁节点
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测试技术学报
双月刊
1671-7449
14-1301/TP
大16开
太原13号信箱
22-14
1986
chi
出版文献量(篇)
2837
总下载数(次)
7
总被引数(次)
13975
论文1v1指导