基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
通过对Web服务器日志文件和客户交易数据进行分析,可以发现相似客户群体、相关Web页面和频繁访问路径.提出了一种新颖的Web日志挖掘算法.在该算法中,首先以Web站点URL为行、以UserID为列建立URL-UserID关联矩阵,元素值为用户的访问次数,然后,对列向量进行相似性分析得到相似客户群体,对行向量进行相似性度量获得相关Web页面,对后者再进一步处理还可以发现频繁访问路径.实验结果表明了算法的有效性.
推荐文章
基于加权矩阵聚类的Web日志挖掘算法
数据挖掘
Web日志挖掘
加权矩阵聚类
多标记传播算法
用户聚类
基于日志挖掘的Web service安全关联规则挖掘算法及应用
日志挖掘
关联规则挖掘
安全性测试
错误注入
Web日志挖掘的预处理及路径补全算法的研究
Web日志挖掘
数据预处理
路径补全
算法
Web日志挖掘改进网站结构的研究
Web挖掘
Web日志
路径分析
网站结构
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Web日志的高效多能挖掘算法
来源期刊 计算机研究与发展 学科 工学
关键词 客户群体聚类 Web页面聚类 频繁访问路径 Web日志挖掘 电子商务
年,卷(期) 2001,(3) 所属期刊栏目
研究方向 页码范围 328-333
页数 6页 分类号 TP391
字数 5120字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 沈钧毅 西安交通大学计算机科学与技术系 211 4319 32.0 55.0
2 宋擒豹 西安交通大学计算机科学与技术系 41 1725 19.0 41.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (264)
同被引文献  (166)
二级引证文献  (949)
2001(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2001(1)
  • 引证文献(1)
  • 二级引证文献(0)
2002(4)
  • 引证文献(4)
  • 二级引证文献(0)
2003(16)
  • 引证文献(10)
  • 二级引证文献(6)
2004(24)
  • 引证文献(10)
  • 二级引证文献(14)
2005(57)
  • 引证文献(28)
  • 二级引证文献(29)
2006(98)
  • 引证文献(31)
  • 二级引证文献(67)
2007(146)
  • 引证文献(32)
  • 二级引证文献(114)
2008(125)
  • 引证文献(28)
  • 二级引证文献(97)
2009(133)
  • 引证文献(19)
  • 二级引证文献(114)
2010(100)
  • 引证文献(19)
  • 二级引证文献(81)
2011(95)
  • 引证文献(21)
  • 二级引证文献(74)
2012(73)
  • 引证文献(11)
  • 二级引证文献(62)
2013(68)
  • 引证文献(8)
  • 二级引证文献(60)
2014(59)
  • 引证文献(16)
  • 二级引证文献(43)
2015(62)
  • 引证文献(8)
  • 二级引证文献(54)
2016(62)
  • 引证文献(7)
  • 二级引证文献(55)
2017(35)
  • 引证文献(4)
  • 二级引证文献(31)
2018(32)
  • 引证文献(3)
  • 二级引证文献(29)
2019(18)
  • 引证文献(3)
  • 二级引证文献(15)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
客户群体聚类
Web页面聚类
频繁访问路径
Web日志挖掘
电子商务
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导