基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
信息检索需要解决的主要问题是为信息索取者提供相关、准确甚至完整的信息.大量的传统检索模型基于词袋假设进行建模,不考虑查询词之间的相互联系.词项邻近度信息在现有的研究中常被用于提升经典信息检索模型的检索效果,但大部分工作没有考虑查询中各个词重要性的差异.在现代信息检索的查询请求中,查询词之间不仅不完全相互独立,而且分别具有不同的重要程度.因此,在计算邻近度信息时对查询词的重要性进行区分,将有助于提高检索效果.带权邻近度BM25模型(WP-BM25)使用待检索数据集的背景信息对查询词的重要性进行区分,并将带权邻近度度量方法整合到BM25模型中.在TREC评测的3个标准数据集FR88-89,WT2G和WT10G上的一系列对比实验表明,该模型具有较好的鲁棒性,且能够使检索效果得到显著提升.
推荐文章
软件故障密度度量研究
软件质量度量
故障密度
代码行
汇编语言
带权相似度度量方法及其在光谱异常判定中的应用
带权相似度
近红外
异常判定
在线监测
光谱分析
结合加权子空间和相似度度量学习的人脸验证方法研究
类内变化
加权子空间
相似度度量学习
人脸验证
基于用例的软件开发进度度量方法
软件度量
进度度量
软件估算
用例点
迭代
用例
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 信息检索中的带权邻近度度量研究
来源期刊 计算机研究与发展 学科 工学
关键词 带权邻近度 度量方法 BM25 查询词重要性 信息检索
年,卷(期) 2014,(10) 所属期刊栏目 信息检索与推荐
研究方向 页码范围 2216-2224
页数 9页 分类号 TP391
字数 5802字 语种 中文
DOI 10.7544/issn1000-1239.2014.20130339
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (29)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (7)
二级引证文献  (3)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1976(1)
  • 参考文献(1)
  • 二级参考文献(0)
1980(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
带权邻近度
度量方法
BM25
查询词重要性
信息检索
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机研究与发展
月刊
1000-1239
11-1777/TP
大16开
北京中关村科学院南路6号
2-654
1958
chi
出版文献量(篇)
7553
总下载数(次)
35
总被引数(次)
164870
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导