原文服务方: 计算机应用研究       
摘要:
Internet上专题资源网页汇聚和检索是垂直搜索引擎中的核心问题,HITS算法是早期解决这个问题的经典算法,很多文献对它进行了改进,但无论索引的主题相关率还是引擎的查准率都有提高的余地.提出一种基于锚文本和标题信息过滤并结合网页内容相关度判断的HITS专题检索策略,利用专题训练集判断主题相关度,很好地解决了只依靠查询字符串判断的弊端.实验表明,此策略能很好地提高专题信息汇聚精确度和检索的准确率,并且减少了非相关URL的下载量.
推荐文章
一种有效的信息检索模型
信息检索
查询扩展
关联规则
查询行为
一种有效的音频信息检索技术
音频检索
小波变换
关联规则挖掘
特征向量
一种支持高效检索的双重索引策略
可扩展标记语言
路径表达式
双重索引
倒排文档
一种基于敏感站点处理的Web信息检索系统
Wen
信息检索
敏感站点
TFIDF
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种有效的专题信息集中和检索策略
来源期刊 计算机应用研究 学科
关键词 HITS算法 锚文本 网页标题 专题相关度 向量模型 专题训练集
年,卷(期) 2010,(6) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2106-2108
页数 分类号 TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2010.06.032
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王宇新 大连理工大学电信学院 88 589 12.0 19.0
2 郭禾 大连理工大学软件学院 86 724 14.0 23.0
3 刘海峰 大连理工大学电信学院 12 58 4.0 7.0
4 陈鑫 大连理工大学软件学院 15 100 7.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (118)
参考文献  (5)
节点文献
引证文献  (7)
同被引文献  (16)
二级引证文献  (3)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(1)
  • 二级参考文献(4)
2007(3)
  • 参考文献(2)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(4)
  • 引证文献(3)
  • 二级引证文献(1)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
HITS算法
锚文本
网页标题
专题相关度
向量模型
专题训练集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导