基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网的崛起为地理信息更新检索提供了一条新的途径,具有实时性强、成本低的优势。文中从实际出发,针对现有爬虫算法的缺陷,提出一种基于链接回溯的地理信息更新主题爬虫方法。首先,结合支持向量机分类技术,能够快速有效地找出一个网站中最有可能包含主题相关内容的链接方向;然后,回溯到这些链接后继续进行爬取,并通过地理信息变化要素知识库确定主题内容,从而优化爬取路径,减少低效率的爬取过程。实验结果表明,该方法可以找出最有可能包含地理信息的链接方向,大幅提高主题爬取效率,在其他主题方向也具有一定的可推广性。
推荐文章
融合链接结构的主题爬虫算法
Best-First算法
链接结构
HITS算法
爬行策略
基于主题相关概念和网页分块的主题爬虫研究
主题爬虫
主题相关概念
网页分块
优先级计算
R-HITS
主题爬虫技术研究综述
网络爬虫
主题爬虫
相似度
网页内容
链接分析
基于URL模式集的主题爬虫
主题爬虫
URL模式
URL前缀树
模式关系图
URL模式重要性
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于链接回溯的地理信息更新主题爬虫研究
来源期刊 计算机技术与发展 学科 工学
关键词 主题爬虫 地理信息更新 支持向量机 回溯算法
年,卷(期) 2014,(7) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 52-55,59
页数 5页 分类号 TP31
字数 3576字 语种 中文
DOI 10.3969/j.issn.1673-629X.2014.07.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张雪英 南京师范大学虚拟地理环境教育部重点实验室 38 592 15.0 23.0
2 吴家皋 南京邮电大学计算机学院 29 90 5.0 8.0
6 余浩 南京邮电大学计算机学院 2 19 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (44)
共引文献  (155)
参考文献  (13)
节点文献
引证文献  (5)
同被引文献  (17)
二级引证文献  (4)
1998(4)
  • 参考文献(1)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(9)
  • 参考文献(1)
  • 二级参考文献(8)
2009(6)
  • 参考文献(4)
  • 二级参考文献(2)
2010(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(4)
  • 参考文献(1)
  • 二级参考文献(3)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(1)
  • 二级引证文献(3)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
主题爬虫
地理信息更新
支持向量机
回溯算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
相关基金
江苏省自然科学基金
英文译名:Natural Science Foundation of Jiangsu Province
官方网址:http://www.jsnsf.gov.cn/News.aspx?a=37
项目类型:
学科类型:
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导