基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
query 和doc 之间的关联关系是搜索引擎期望获取的一类有价值的信息. query 和doc 间准确的关联分析不仅可以帮助搜索结果排序,也在query和doc之间的桥接中起到重要作用,以实现相关query和doc之间的信息传递,有利于更深入的query 理解和doc 理解,并在此基础上开展相关应用.本文提出了一种基于用户搜索行为的query 和doc 关联关系挖掘算法,该方法首先对用户搜索点击日志中的数据进行整理与分析,构建query与doc间的二部图,再通过采用马尔可夫随机游走模型对二部图数据进行建模,挖掘二部图中的点击数据和session 数据,最终挖掘出点击日志中用户没有点击到的doc 数据,从而预测出query 和doc 间的隐含关联关系,同时也可以利用该算法得到query 和query 潜在的关联关系.基于以上理论基础,我们实现了一套完整的日志挖掘系统,通过大量的实验对比,该系统在各方面均取得了优异的表现,其中对检索结果相关性的性能提升可以达到71.23%,这充分表明,本文所提出的理论和算法能够很好地解决query和doc之间的隐含关系挖掘问题,为提高搜索结果的召回率、实现查询推荐和检索结果聚类奠定了良好的前提基础.
推荐文章
基于NetFlow的用户行为挖掘算法设计
NetFlow
数据挖掘
用户行为
行为距离
基于网络用户行为的相关页面挖掘模型
相关页面
web挖掘
网络用户行为
Web用户行为模式挖掘研究
数据挖掘
Web挖掘
行为模式Web用户行为模式挖掘
基于数据挖掘的用户安全行为分析
行为分析
身份识别
数据挖掘
关联规则
网络安全
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于用户搜索行为的query-do c关联挖掘
来源期刊 自动化学报 学科
关键词 关联关系 搜索行为 马尔可夫随机游走 查询推荐 检索结果聚类
年,卷(期) 2014,(8) 所属期刊栏目 论文与报告
研究方向 页码范围 1654-1666
页数 13页 分类号
字数 13231字 语种 中文
DOI 10.3724/SP.J.1004.2014.01654
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 左万利 吉林大学计算机科学与技术学院 88 1273 20.0 31.0
5 陆静雅 吉林大学计算机科学与技术学院 2 9 2.0 2.0
9 朱亮 吉林大学计算机科学与技术学院 1 7 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (66)
共引文献  (87)
参考文献  (7)
节点文献
引证文献  (7)
同被引文献  (45)
二级引证文献  (11)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(9)
  • 参考文献(0)
  • 二级参考文献(9)
2010(15)
  • 参考文献(1)
  • 二级参考文献(14)
2011(10)
  • 参考文献(1)
  • 二级参考文献(9)
2012(5)
  • 参考文献(5)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(4)
  • 引证文献(3)
  • 二级引证文献(1)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(7)
  • 引证文献(1)
  • 二级引证文献(6)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
关联关系
搜索行为
马尔可夫随机游走
查询推荐
检索结果聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导