原文服务方: 西安交通大学学报       
摘要:
为了提高搜索引擎返回结果的可浏览性,满足用户对查询质量的要求,提出了一种层次化搜索结果聚类方法.首先,从搜索引擎的返回结果提取出文档集,并对每一个文档进行词干化、去除停用词等操作.然后,根据词共现信息来发现文档集中的频繁2元组,再将2元组扩展为n元组,对所有元组进行去冗余、重要性排序,从而获得候选聚类标签.最后,基于该标签对返回结果中的文档进行分配与聚集,形成层次化聚类结果.实验结果表明,所提方法可以通过获得的准确、可读性较好的聚类标签,帮助用户有效地浏览搜索引擎返回的结果.与Vivisimo、STC、Lingo算法比较,以及在多个评价指标上的综合实验结果也表明,该方法是有效的.
推荐文章
一种结合K-Means的层次化的搜索结果聚类方法
搜索结果聚类
层次化聚类
类标签
基于PLSI的标签聚类研究
大众分类
概率潜在语义索引
语义标签
回火期望最大化算法
凝聚式层次k中心点聚类
基于K-center和信息增益的Web搜索结果聚类方法
Web文档
聚类
聚类标志
K-center
信息增益
植入引导式层次聚类Mashup服务推荐算法
引导
层次聚类
Mashup
标签
服务推荐
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用标签的层次化搜索结果聚类方法
来源期刊 西安交通大学学报 学科
关键词 搜索结果聚类 词共现 候选聚类标签 层次化聚类
年,卷(期) 2009,(4) 所属期刊栏目
研究方向 页码范围 18-21,38
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3321/j.issn:0253-987X.2009.04.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 冯博琴 西安交通大学电子与信息工程学院 171 3268 30.0 50.0
2 张云 西安交通大学电子与信息工程学院 17 331 10.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (14)
参考文献  (1)
节点文献
引证文献  (9)
同被引文献  (21)
二级引证文献  (21)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2012(4)
  • 引证文献(2)
  • 二级引证文献(2)
2013(5)
  • 引证文献(1)
  • 二级引证文献(4)
2014(4)
  • 引证文献(1)
  • 二级引证文献(3)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(5)
  • 引证文献(1)
  • 二级引证文献(4)
2017(4)
  • 引证文献(0)
  • 二级引证文献(4)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
搜索结果聚类
词共现
候选聚类标签
层次化聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导