原文服务方: 计算机应用研究       
摘要:
为了提高网络蜘蛛在爬行网络论坛时的爬行效率,从论坛布局结构特点出发,分析论坛所具有的普遍特征,设计了一个针对论坛的特殊的网络蜘蛛爬行策略.通过对大量论坛的布局结构分析发现,用户感兴趣的信息都使用设计者事先设计好的布局结构展现给用户.而这种布局结构可以通过DOM树体现出来,对DOM树进行操作,提取出URL,然后对重复的URL进行过滤.实验表明该爬行策略提高了网络蜘蛛爬行效率,节省网络带宽及本地存储空间.
推荐文章
无线泛在网络全局用户标识方案设计的研究
无线泛在网络
用户标识
全局用户
网络安全
面向主题的网络蜘蛛技术研究及系统实现
信息收集
主题蜘蛛
相关度计算
搜索策略
CORBA在网络管理中的研究与应用
CORBA
网络管理
分布式计算
面向对象
"红蜘蛛多媒体网络教室"--网络教学好助手
红蜘蛛多媒体网络教室
运行环境
功能
使用
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 网络蜘蛛在网络论坛领域的研究与设计
来源期刊 计算机应用研究 学科
关键词 网络蜘蛛 文档对象模型树 页面重复区域 爬行策略 重复模板
年,卷(期) 2011,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 492-494,520
页数 分类号 TP311.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2011.02.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 胡德敏 上海理工大学光电信息与计算机工程学院 44 241 10.0 13.0
2 滕召生 上海理工大学光电信息与计算机工程学院 1 3 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络蜘蛛
文档对象模型树
页面重复区域
爬行策略
重复模板
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导