基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对分布式信息检索时不同信息集对最终检索结果贡献度有差异的现象,提出基于历史点击数据的集合选择方法(PCTD-CS).该方法利用点击数据估计各集合与历史查询的相关度.采用基于关键词和基于检索结果相结合的方法估计查询间的相似度.利用历史查询中的相似查询估计新查询与各集合的相关度,选择相关度最高的M个集合进行检索,给出要获取前k个文档的情况下各集合应当返回的文档数.采用召回率Rm、前n个检索结果的准确率P@n及平均准确率MAP对集合选择方法的性能进行验证.实验结果表明,采用PCTD-CS方法提高了检索结果的召回率和准确率,能够更准确地定位到包含相关文档多的集合.
推荐文章
基于用户点击数据的细粒度图像识别方法概述
用户点击
图像识别
度量学习
深度学习
语义鸿沟
基于历史矢量数据的土地覆被样本自动选择方法
土地覆被
分类
样本自动选择
历史矢量
集合CHI与IG的特征选择方法
文本分类
特征选择
卡方统计
信息增益
基于点击流数据仓库的用户行为分析
点击流
数据仓库
Web服务器日志
SQLServer2005
联机分析处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于历史点击数据的集合选择方法
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 分布式信息检索 集合选择 相似查询 点击数据
年,卷(期) 2013,(1) 所属期刊栏目 计算机技术、电信技术
研究方向 页码范围 23-28,161
页数 7页 分类号 TP311
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2013.01.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式信息检索
集合选择
相似查询
点击数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导