基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在分析相关spider技术的基础上,提出了将强化学习技术应用到垂直搜索引擎的可控网络爬虫方法.该方法通过强化学习技术得到一些控制“经验信息”,根据这些信息来预测较远的回报,按照某一主题进行搜索,以使累积返回的回报值最大.将得到的网页存储、索引,用户通过搜索引擎的搜索接口,就可以得到最佳的搜索结果.对多个网站进行主题爬虫搜索,实验结果表明,该方法对于网络的查全率和查准率都具有较大的提高.
推荐文章
一种基于本体的垂直搜索引擎系统模型
搜索引擎
垂直搜索引擎
本体
语义
石油信息垂直搜索引擎技术
石油行业
垂直搜索引擎
系统架构
系统功能
一种基于信息推送的搜索引擎模型
信息推送
搜索引擎
用户兴趣
资源迷向
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 RL_Spider:一种自主垂直搜索引擎网络爬虫
来源期刊 计算机应用与软件 学科 工学
关键词 可控强化学习 垂直搜索引擎 网络爬虫
年,卷(期) 2011,(12) 所属期刊栏目 应用技术与研究
研究方向 页码范围 183-187
页数 分类号 TP301.4
字数 6609字 语种 中文
DOI 10.3969/j.issn.1000-386X.2011.12.054
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘全 苏州大学计算机科学与技术学院 99 1053 16.0 29.0
2 刘忠 苏州大学计算机科学与技术学院 9 181 4.0 9.0
3 黄蔚 苏州大学计算机科学与技术学院 15 47 5.0 6.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (151)
参考文献  (4)
节点文献
引证文献  (11)
同被引文献  (9)
二级引证文献  (4)
1959(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(3)
  • 参考文献(0)
  • 二级参考文献(3)
1994(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(5)
  • 引证文献(3)
  • 二级引证文献(2)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2016(3)
  • 引证文献(3)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
可控强化学习
垂直搜索引擎
网络爬虫
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用与软件
月刊
1000-386X
31-1260/TP
大16开
上海市愚园路546号
4-379
1984
chi
出版文献量(篇)
16532
总下载数(次)
47
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导