基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文章介绍了体育新闻搜索引擎系统 Geeking的框架结构和各项功能,其结构分为网页爬取、胜者表构建、检索处理、用户界面4个部分,其主要功能包含查询词校正、自动补全、检索结果排序、相似新闻聚类以及显示页面中关键词高亮并提供网页快照。输入查询请求时,系统根据搜索日志和新闻热词自动补全查询词,搜索不到相关结果时校正查询,给出推荐的查询词。检索新闻文档时,使用胜者表快速查找查询词项的相关文档,综合 tf-idf权重和新闻标题、发布时间等因素计算文档的相关性并按得分排序。在相似新闻聚类中,结合最长公共子序列和编辑距离衡量新闻标题之间的相似度,以新闻标题相似度代表新闻文档的相似度。测试结果表明,基于胜者表的 Geeking搜索引擎系统各项功能协调效果好,检索响应速度快。
推荐文章
基于Lucene的搜索引擎的研究与应用
Lueene
网络爬虫
索引
搜索
新闻搜索引擎
搜索引擎营销发展研究
搜索引擎
搜索营销
营销发展趋势
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 Geeking:基于胜者表的体育新闻搜索引擎系统
来源期刊 集成技术 学科 工学
关键词 搜索引擎 体育新闻 胜者表 编辑距离 聚类 查询词校正
年,卷(期) 2016,(2) 所属期刊栏目
研究方向 页码范围 97-108
页数 12页 分类号 TP391.3
字数 8460字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (53)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
搜索引擎
体育新闻
胜者表
编辑距离
聚类
查询词校正
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
集成技术
双月刊
2095-3135
44-1691/T
大16开
深圳市南山区西丽深圳大学城学苑大道1068号
2012
chi
出版文献量(篇)
677
总下载数(次)
2
总被引数(次)
1808
论文1v1指导