基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大规模网页相关性排序工作中使用的多来源网页信息形式多样、利用困难的问题,提出了一种新的自动网页特征获取方法.该方法利用一组事先定义好的规则自动地从网页中获取相关性特征,这些特征可以有效地表达网页的实际内容并改善搜索引擎的排序性能.该方法所获取的网页相关性特征具有格式统一、噪声数据少的特点,能够非常方便地应用于网页的相关性排序.为了评价网页特征和用户查询之间的相关性,还提出了一个特征级别的相关性判定标准.最后,实验结果证明了所提出的特征获取方法和特征相关性等级判定标准对于提升搜索引擎的排序性能具有显著的作用.
推荐文章
一种编辑距离算法及其在网页搜索中的应用
网页搜索
相关性排序
编辑距离
字符串匹配
Photoshop在网页设计中的作用
photoshop
网页设计
作用
情感化设计在网页应用界面中的应用
情感化设计
网页界面
应用
浅谈FlashMX在网页动画制作中的应用
场景
元件
渐变动画
逐帧动画
影片剪辑
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网页特征获取方法及其在网页搜索中的应用
来源期刊 东南大学学报(英文版) 学科 工学
关键词 网页搜索 相关性排序 检索效率
年,卷(期) 2008,(3) 所属期刊栏目
研究方向 页码范围 330-334
页数 5页 分类号 TP391
字数 732字 语种 英文
DOI 10.3969/j.issn.1003-7985.2008.03.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 沈钧毅 西安交通大学计算机科学与技术系 211 4319 32.0 55.0
2 鲍军鹏 西安交通大学计算机科学与技术系 18 301 7.0 17.0
3 薛晔伟 西安交通大学计算机科学与技术系 2 31 2.0 2.0
4 张云 西安交通大学计算机科学与技术系 17 331 10.0 17.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (2)
同被引文献  (9)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网页搜索
相关性排序
检索效率
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
东南大学学报(英文版)
季刊
1003-7985
32-1325/N
大16开
南京四牌楼2号
1984
eng
出版文献量(篇)
2004
总下载数(次)
1
总被引数(次)
8843
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导