基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
WEB数据挖掘的关键是设计智能、高效的网络机器人.详细分析了面向URL的网络机器人的工作流程及实现它的关键技术,提出用多个队列管理URL列表,且队列元素按文档相关性高低排序,并行高速地下载网页.此外,在文档相关性计算中设计了一个可收敛的迭代阈值算法,有效地解决了相关度阈值设定的随意性.
推荐文章
网络机器人多线程爬行的研究与实现
网络机器人
多线程爬行
并发调度
URL消重
可重组机器人教学模型的建立及软件实现
可重组机器人
教学模型
机器手
中医药主题搜索网络机器人的设计与实现
搜索引擎
网络机器人
中医药
面向多机器人动态任务分配的事件驱动免疫网络算法
免疫网络
多机器人系统
动态任务
自主协作
事件驱动
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向URL的网络机器人软件模型的研究与实现
来源期刊 华东交通大学学报 学科 工学
关键词 网络机器人 URL种子 广度优先 文档相关性 阈值
年,卷(期) 2007,(1) 所属期刊栏目 电子电气与计算机科学
研究方向 页码范围 67-70
页数 4页 分类号 TP2
字数 3227字 语种 中文
DOI 10.3969/j.issn.1005-0523.2007.01.018
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李广丽 华东交通大学信息工程学院 34 209 8.0 12.0
2 刘觉夫 华东交通大学信息工程学院 45 307 9.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (14)
共引文献  (51)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (0)
二级引证文献  (0)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络机器人
URL种子
广度优先
文档相关性
阈值
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华东交通大学学报
双月刊
1005-0523
36-1035/U
大16开
中国南昌
1984
chi
出版文献量(篇)
3963
总下载数(次)
12
总被引数(次)
24304
论文1v1指导