原文服务方: 西安交通大学学报       
摘要:
将Web爬行看作执行序列动作的过程, 结合改进的快速Q学习和半监督贝叶斯分类器,提出一种新的具有在线增量自学习能力的聚焦爬行方法.该方法从获取的页面中抽取特征文本,根据特征文本评估页面的主题相关性,预测链接的Q值,然后基于Q值过滤无关链接.当得到主题相关页面时产生回报,将回报沿链接链路反馈,更新链路上所有链接的Q值,并选择相应的特征文本作为训练样本,增量地改善主题评估器和Q值预测器.实验结果表明,该方法具有很快的自学习能力,获取的页面数目和精度均优于离线聚焦爬行方法,更符合Web资源发现的要求.
推荐文章
自学习神经元及自学习BP网络
自学习神经元
自学习BP网络
学习策略
面向神经元
具有在线自学习能力的脑电信号分类方法
自学习
EEG
识别
AdaBoost算法
金属探测器中自学习方法的研究
金属探测器
磁场
相位
净水厂混凝投药量的自学习模糊控制
混凝剂投加量
模糊控制
自学习
水处理
自动化
浊度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 可在线增量自学习的聚焦爬行方法
来源期刊 西安交通大学学报 学科
关键词 资源发现 聚焦爬行 在线学习 半监督学习
年,卷(期) 2004,(6) 所属期刊栏目
研究方向 页码范围 599-602
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.3321/j.issn:0253-987X.2004.06.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 傅向华 西安交通大学电子与信息工程学院 24 443 15.0 20.0
2 马兆丰 西安交通大学电子与信息工程学院 25 446 12.0 20.0
3 何明 西安交通大学电子与信息工程学院 17 370 13.0 17.0
4 冯博琴 西安交通大学电子与信息工程学院 171 3268 30.0 50.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (28)
参考文献  (4)
节点文献
引证文献  (67)
同被引文献  (37)
二级引证文献  (568)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2006(4)
  • 引证文献(4)
  • 二级引证文献(0)
2007(17)
  • 引证文献(7)
  • 二级引证文献(10)
2008(21)
  • 引证文献(4)
  • 二级引证文献(17)
2009(43)
  • 引证文献(8)
  • 二级引证文献(35)
2010(45)
  • 引证文献(8)
  • 二级引证文献(37)
2011(44)
  • 引证文献(7)
  • 二级引证文献(37)
2012(38)
  • 引证文献(3)
  • 二级引证文献(35)
2013(51)
  • 引证文献(4)
  • 二级引证文献(47)
2014(45)
  • 引证文献(4)
  • 二级引证文献(41)
2015(56)
  • 引证文献(4)
  • 二级引证文献(52)
2016(60)
  • 引证文献(4)
  • 二级引证文献(56)
2017(73)
  • 引证文献(4)
  • 二级引证文献(69)
2018(77)
  • 引证文献(4)
  • 二级引证文献(73)
2019(42)
  • 引证文献(1)
  • 二级引证文献(41)
2020(18)
  • 引证文献(1)
  • 二级引证文献(17)
研究主题发展历程
节点文献
资源发现
聚焦爬行
在线学习
半监督学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西安交通大学学报
月刊
0253-987X
61-1069/T
大16开
1960-01-01
chi
出版文献量(篇)
7020
总下载数(次)
0
总被引数(次)
81310
相关基金
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导