原文服务方: 计算机应用研究       
摘要:
针对单一价值评价的聚焦爬虫搜索策略存在主题漂移等问题进行了研究,充分利用量子进化算法所具有的智能性,提出一种新的聚焦爬虫爬行算法.该算法充分结合网页在互联网上的分布特点,利用立即价值和未来价值两类评价标准的优势,根据聚焦爬虫实际运行过程中的搜索情况,在线调整这两种标准在综合价值中的比重.实验仿真结果表明,相对于单一价值的搜索策略,量子进化算法获得较高的页面查全率和信息查准率,能较好地解决现存问题,具有一定的自适应性.
推荐文章
基于自适应免疫进化算法的聚焦爬虫搜索策略
聚焦爬虫
搜索策略
主题相关度
自适应免疫进化算法
基于遗传算法的聚焦爬虫搜索策略
聚焦爬虫
遗传算法
小生境
主题相关度
基于内容评价的爬虫搜索策略研究
信息安全
内容安全
内容评价
网络爬虫
量子进化组播路由算法
遗传算法
早熟
量子进化算法
组播路由问题
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于量子行为进化算法的聚焦爬虫搜索策略
来源期刊 计算机应用研究 学科
关键词 聚焦爬虫 主题相关度 立即价值 未来价值 量子进化算法
年,卷(期) 2012,(11) 所属期刊栏目 网络与通信技术
研究方向 页码范围 4280-4283
页数 4页 分类号 TP393
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.11.071
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李盼池 东北石油大学计算机与信息技术学院 93 344 9.0 11.0
2 刘丽杰 黑龙江八一农垦大学信息技术学院 35 84 5.0 6.0
3 张强 东北石油大学计算机与信息技术学院 89 201 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (11)
共引文献  (13)
参考文献  (9)
节点文献
引证文献  (2)
同被引文献  (9)
二级引证文献  (3)
1998(3)
  • 参考文献(1)
  • 二级参考文献(2)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(6)
  • 参考文献(1)
  • 二级参考文献(5)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
聚焦爬虫
主题相关度
立即价值
未来价值
量子进化算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导