基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
根据近来对地理信息Web服务搜索引擎的研究,设计一种基于网络爬虫自动采集POI(Point Of Interest)深度服务信息的方法。使用网络爬虫与DOM(Document Object Model)技术从发布相关POI深度服务信息的网站抓取实时信息,并通过编辑距离与针对地址匹配的改进最大公共子序列分析页面内容与PO I主题相关度,进而将相关度最高的深度服务信息与PO I点匹配,生成深度服务信息点特征。实验证明了方法的有效性。
推荐文章
基于HTMLParser信息提取的网络爬虫设计
网络爬虫
垂直搜索
HTMLParser
基于WebKit的网络爬虫
网络爬虫
浏览器引擎
WebKit
JavaScript
基于网络爬虫的森林经营知识采集系统研建
森林经理学
森林经营知识
知识库
知识采集
网络爬虫
基于分层结构保留的增量网络爬虫算法
网络爬虫
URL过滤器
层次结构保存
频率模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于网络爬虫的导航深度服务信息自动采集
来源期刊 测绘工程 学科 地球科学
关键词 POI 深度服务信息 网络爬虫 DOM 编辑距离 最大公共子序列
年,卷(期) 2015,(1) 所属期刊栏目 学术研究
研究方向 页码范围 17-24
页数 8页 分类号 P208
字数 8861字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 康志忠 中国地质大学土地科学技术学院 10 79 5.0 8.0
2 陈睿嘉 中国地质大学土地科学技术学院 1 12 1.0 1.0
3 张卫涛 1 12 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (91)
共引文献  (216)
参考文献  (11)
节点文献
引证文献  (12)
同被引文献  (32)
二级引证文献  (33)
1976(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2000(6)
  • 参考文献(0)
  • 二级参考文献(6)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(12)
  • 参考文献(1)
  • 二级参考文献(11)
2005(7)
  • 参考文献(0)
  • 二级参考文献(7)
2006(15)
  • 参考文献(1)
  • 二级参考文献(14)
2007(5)
  • 参考文献(2)
  • 二级参考文献(3)
2008(12)
  • 参考文献(0)
  • 二级参考文献(12)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(9)
  • 参考文献(2)
  • 二级参考文献(7)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(6)
  • 引证文献(4)
  • 二级引证文献(2)
2017(5)
  • 引证文献(1)
  • 二级引证文献(4)
2018(6)
  • 引证文献(2)
  • 二级引证文献(4)
2019(21)
  • 引证文献(4)
  • 二级引证文献(17)
2020(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
POI
深度服务信息
网络爬虫
DOM
编辑距离
最大公共子序列
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测绘工程
双月刊
1006-7949
23-1394/TF
大16开
哈尔滨市道外区红旗大街999号
14-322
1992
chi
出版文献量(篇)
2818
总下载数(次)
9
总被引数(次)
23770
论文1v1指导