作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在深入分析了HTML页面的超链结构的基础上,加入了锚文本内容分析权重和动态评价策略,提出了算法的改进,形成了综合动态价值的URL链接结构的搜索策略.改进的算法根据链接类型的不同赋予了不同的权重因子,并结合了动态价值评价穿越"隧道",简化了优先级的计算,有效地降低了"短视"问题和"主题漂移"现象,是一种高效实用的主题采集策略.
推荐文章
基于链接和内容的BLCT主题爬行算法研究
垂直搜索引擎
PageRank算法
主题爬行
链接相似度
内容相似度
基于URL模式集的主题爬虫
主题爬虫
URL模式
URL前缀树
模式关系图
URL模式重要性
融合链接结构的主题爬虫算法
Best-First算法
链接结构
HITS算法
爬行策略
基于信息增益的自适应主题爬行策略
主题爬行
维基百科
主题描述
自适应方法
信息增益
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于动态评价URL链接结构的主题爬行策略
来源期刊 福建电脑 学科 工学
关键词 主题搜索引擎 URL 链接结构 主题爬虫
年,卷(期) 2010,(2) 所属期刊栏目 应用与开发
研究方向 页码范围 83-84,96
页数 3页 分类号 TP3
字数 3625字 语种 中文
DOI 10.3969/j.issn.1673-2782.2010.02.056
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (48)
参考文献  (6)
节点文献
引证文献  (5)
同被引文献  (0)
二级引证文献  (0)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(6)
  • 参考文献(1)
  • 二级参考文献(5)
1999(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(4)
  • 参考文献(3)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(2)
  • 二级参考文献(0)
2010(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2010(2)
  • 引证文献(2)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主题搜索引擎
URL
链接结构
主题爬虫
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
福建电脑
月刊
1673-2782
35-1115/TP
大16开
福州市华林邮局29号信箱
1985
chi
出版文献量(篇)
21147
总下载数(次)
86
总被引数(次)
44699
论文1v1指导