基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
网络搜索分析在优化搜索引擎方面具有举足轻重的作用,而且对用户个人搜索特性进行分析能够提高搜索引擎的精准度.目前,大多数已有模型(比如点击图模型及其变体),注重研究用户群体的共同特点.然而,关于如何做到既可以获取用户群体共同特点又可以获取用户个人特点方面的研究却非常少.本文研究了基于个人用户网络搜索分析新问题,即通过研究用户搜索的突发性现象,获取个人用户搜索查询的主题分布情况.提出了两个搜索主题模型,即搜索突发性模型(SBM)和耦合敏感搜索突发性模型(CS-SBM).SBM假设查询词和URL主题是无关的,CS-SBM假设查询词和URL之间是有主题关联的,得到的主题分布信息存储在偏Dirichlet先验中,采用Beta分布刻画用户搜索的时间特性.实验结果表明,每一个用户的网络搜索轨迹都有多种基于用户的独有特点.同时,在使用大量真实用户查询日志数据情况下,与LDA、DCMLDA、TOT相比,本文提出的模型具有明显的泛化性能优势,并且有效地描绘了用户搜索查询主题在时间上的变化过程.
推荐文章
基于Hive的海量搜索日志分析系统研究
Hadoop
MapReduce
HQL语言
Web日志
搜索引擎
用户行为分析
元搜索引擎中基于用户兴趣的查询结果合成研究
个性化
元搜索引擎
查询结果合成
用户兴趣
基于中文搜索引擎网络信息用户行为研究
中文搜索引擎
搜索日志
用户搜索行为
网络用户
基于Agent的面向主题信息查询研究
信息查询
Agent
面向主题
信息推送
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于用户查询日志的网络搜索主题分析
来源期刊 智能系统学报 学科 工学
关键词 网络搜索 搜索引擎 自然语言处理 主题模型 文本挖掘 突发性 时间分析 参数估计
年,卷(期) 2017,(5) 所属期刊栏目
研究方向 页码范围 668-677
页数 10页 分类号 TP391
字数 7846字 语种 中文
DOI 10.11992/tis.201706096
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (23)
共引文献  (302)
参考文献  (10)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (4)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(5)
  • 参考文献(2)
  • 二级参考文献(3)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
网络搜索
搜索引擎
自然语言处理
主题模型
文本挖掘
突发性
时间分析
参数估计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导