基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对伪相关反馈模型反馈文档信息质量差和扩展词选择不适产生的漂移现象等问题,提出了一种基于约束的半监督聚类查询扩展方法.该方法对初检结果的前k个文档进行人工标注,分成相关文档与不相关文档两类;并利用一种半监督聚类算法对初检结果的前n个文档进行分析,提取出与查询相关的文档作为反馈文档.该方法通过对少量标注文档与查询相关性的学习,能够较准确地估计出大量未知文档与查询的相关性,提高反馈文档的质量,从而有效提高检索的查全率和查准率.实验结果表明,该方法比传统的伪相关反馈和基于无监督聚类的伪相关反馈有更优的检索性能.
推荐文章
半监督聚类中基于密度的约束扩展方法
半监督聚类
基于密度的距离
约束扩展
扩展约束的半监督谱聚类算法研究
半监督学习
成对约束
半监督谱聚类
距离矩阵
基于成对约束的主动半监督文本聚类
文本聚类
半监督聚类
潜在语义索引
成对约束
一种基于Seeds集和成对约束的半监督聚类算法
半监督聚类
Seeds集
成对约束
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于约束的半监督聚类查询扩展方法
来源期刊 中国科技论文 学科 工学
关键词 信息检索 查询扩展 约束聚类 半监督聚类 伪相关反馈
年,卷(期) 2013,(10) 所属期刊栏目
研究方向 页码范围 994-997
页数 4页 分类号 TP391
字数 3654字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨静 哈尔滨工程大学计算机科学与技术学院 178 2073 24.0 37.0
2 刘宁 哈尔滨工程大学计算机科学与技术学院 20 74 5.0 7.0
3 张键沛 哈尔滨工程大学计算机科学与技术学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (1)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
信息检索
查询扩展
约束聚类
半监督聚类
伪相关反馈
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国科技论文
月刊
2095-2783
10-1033/N
大16开
北京市海淀区中关村大街35号教育部科技发展中心
2006
chi
出版文献量(篇)
4942
总下载数(次)
10
总被引数(次)
14783
论文1v1指导