作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
研究如何准确快速获取Deep Web网络资源.提出了一种基于主题的Deep Web聚焦爬虫框架,该框架主要包含了爬行模块、网页分类模块、链接解析模块和查询接口判别模块4大模块.实验结果表明,该爬虫的爬行策略取得了很好的效果,大大提高了效率,可以很好地适应特定主题的结构化Deep Web信息采集.
推荐文章
一种Deep Web聚焦爬虫爬行策略
结构化Deep Web数据源
聚焦爬虫
决策树分类器
基于最优查询的多领域deep Web爬虫
deep Web
deep Web爬虫
最优查询
页面聚类
基于本体的Deep Web数据源聚焦搜索系统研究
本体
Deep Web数据源
聚焦搜索
基于主题网络爬虫思想的Web数据挖掘算法探讨
主题网络爬虫
数据挖掘
算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主题的Deep Web聚焦爬虫研究与设计
来源期刊 西北师范大学学报(自然科学版) 学科 工学
关键词 Deep Web 聚焦爬虫 主题
年,卷(期) 2013,(2) 所属期刊栏目 计算机与信息科学
研究方向 页码范围 40-43,48
页数 5页 分类号 TP311.13
字数 3542字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姚双良 江苏科技大学教务处 19 105 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (62)
共引文献  (147)
参考文献  (12)
节点文献
引证文献  (5)
同被引文献  (12)
二级引证文献  (6)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(12)
  • 参考文献(0)
  • 二级参考文献(12)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(7)
  • 参考文献(2)
  • 二级参考文献(5)
2008(11)
  • 参考文献(4)
  • 二级参考文献(7)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(9)
  • 参考文献(1)
  • 二级参考文献(8)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(4)
  • 参考文献(4)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(4)
  • 引证文献(4)
  • 二级引证文献(0)
2015(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(3)
  • 引证文献(1)
  • 二级引证文献(2)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
Deep Web
聚焦爬虫
主题
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西北师范大学学报(自然科学版)
双月刊
1001-988X
62-1087/N
大16开
甘肃兰州安宁东路967号
54-53
1942
chi
出版文献量(篇)
3180
总下载数(次)
2
总被引数(次)
17931
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导