基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前,我国的网页数量已经达到三百多亿,并且正以年增长率超过百分之百的速度飞速增长.为了从众多的网页中快速高效准确地找到需要的信息,主题爬虫孕育而生,它从网络上选择用户需要的主题信息下载,为用户提供庞大的数据信息支持.本文研究可定制关键词(即主题)的基于.NET的更加精准有效的网络爬虫的设计和实现.通过实验及实际应用验证,该爬虫的精准率大大高于普通的爬虫.
推荐文章
主题网络爬虫研究综述
主题网络爬虫
信息检索
Web挖掘
基于Heritrix主题爬虫的定制与实现
主题爬虫
定制与实现
基于主题网络爬虫思想的Web数据挖掘算法探讨
主题网络爬虫
数据挖掘
算法
基于Web的网络爬虫的设计与实现
搜索引擎
网络爬虫
信息检索
页面索引
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主题定制的专利网络爬虫的设计与实现
来源期刊 计算机与现代化 学科 工学
关键词 可定制关键词 网络爬虫 NET
年,卷(期) 2011,(7) 所属期刊栏目 网络与通信
研究方向 页码范围 52-55
页数 分类号 TP393
字数 2982字 语种 中文
DOI 10.3969/j.issn.1006-2475.2011.07.015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李建民 南昌大学信息工程学院计算机科学与技术系 43 444 12.0 19.0
2 林振荣 南昌大学信息工程学院计算机科学与技术系 35 214 8.0 12.0
3 张睿涵 南昌大学信息工程学院计算机科学与技术系 1 11 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (38)
共引文献  (88)
参考文献  (15)
节点文献
引证文献  (11)
同被引文献  (11)
二级引证文献  (0)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(5)
  • 参考文献(0)
  • 二级参考文献(5)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(6)
  • 参考文献(0)
  • 二级参考文献(6)
2008(6)
  • 参考文献(1)
  • 二级参考文献(5)
2009(10)
  • 参考文献(9)
  • 二级参考文献(1)
2010(4)
  • 参考文献(4)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(3)
  • 引证文献(3)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
可定制关键词
网络爬虫
NET
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导