基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章围绕网络日志中是否蕴含用户访问Web的规律性特性以及如何利用这些特性,研究了日志规模与用户数、Web文档数以及单位用户访问的Web文档数的关系;通过用户对Web访问动机的分析得出结论:一定时间段的Web访问日志中蕴含了用户的稳定兴趣;利用日志中蕴含的用户稳定兴趣,提出了一个基于用户行为的相关文档检索模型和搜索引擎系统SISI.SISI的实际检索性能与分析检索模型所得结论一致:检索准确率和检索时间主要依赖于用户数,检索返回的记录数主要依赖于文档数.
推荐文章
基于网络日志挖掘技术数据信息分析的研究
日志挖掘
数据分析
信息检索
网络日志
一种网络日志属性挖掘与分析方法
网络日志
日志属性
活跃期
地域属性
LDA模型
基于Hadoop的网络日志挖掘方案的设计
网络日志
数据挖掘
数据清洗
Hadoop
MySQL
基于网络日志分析的混合策略主题爬虫
主题爬虫
网络日志
主题群落
用户兴趣
混合策略
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络日志规模分析和用户兴趣挖掘
来源期刊 计算机学报 学科 工学
关键词 Web日志挖掘 日志规模 兴趣 用户行为
年,卷(期) 2005,(9) 所属期刊栏目 研究论文与技术报告
研究方向 页码范围 1483-1496
页数 14页 分类号 TP311
字数 10355字 语种 中文
DOI 10.3321/j.issn:0254-4164.2005.09.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 白硕 中国科学院计算技术研究所软件研究室 50 2124 21.0 46.0
2 郭岩 中国科学院计算技术研究所软件研究室 24 587 11.0 24.0
6 张凯 中国科学院计算技术研究所软件研究室 105 1451 21.0 34.0
7 杨志峰 中国科学院计算技术研究所软件研究室 7 189 3.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (93)
参考文献  (6)
节点文献
引证文献  (137)
同被引文献  (115)
二级引证文献  (681)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(3)
  • 参考文献(1)
  • 二级参考文献(2)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(10)
  • 引证文献(9)
  • 二级引证文献(1)
2007(26)
  • 引证文献(10)
  • 二级引证文献(16)
2008(34)
  • 引证文献(10)
  • 二级引证文献(24)
2009(59)
  • 引证文献(22)
  • 二级引证文献(37)
2010(66)
  • 引证文献(22)
  • 二级引证文献(44)
2011(72)
  • 引证文献(14)
  • 二级引证文献(58)
2012(62)
  • 引证文献(8)
  • 二级引证文献(54)
2013(58)
  • 引证文献(8)
  • 二级引证文献(50)
2014(68)
  • 引证文献(8)
  • 二级引证文献(60)
2015(78)
  • 引证文献(9)
  • 二级引证文献(69)
2016(73)
  • 引证文献(5)
  • 二级引证文献(68)
2017(72)
  • 引证文献(2)
  • 二级引证文献(70)
2018(59)
  • 引证文献(6)
  • 二级引证文献(53)
2019(64)
  • 引证文献(4)
  • 二级引证文献(60)
2020(17)
  • 引证文献(0)
  • 二级引证文献(17)
研究主题发展历程
节点文献
Web日志挖掘
日志规模
兴趣
用户行为
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
论文1v1指导