原文服务方: 计算机应用研究       
摘要:
结合信息增益,提出了一种新的自适应主题爬行策略.利用维基百科的分类树和主题描述文档构建主题向量7,并在爬行过程中不断地进行自动学习,反馈更新主题向量空间中每个概念的权重,完善主题描述.实验结果表明,该方法具有增量爬行的能力,并在信息量总和上明显优于基于the interest ratio的自适应策略;且前者所爬取的网页更接近于与主题相关.
推荐文章
基于维基百科和网页相似度分析的主题爬行策略
维基百科
文本相关性
链接分析
相似度计算
基于BP神经网络的增益量化中的阶距自适应
语音编码
非线性预测
自适应量化
基于XML的智能界面自适应策略
智能界面
XML
自适应策略
增益调度自适应恒压控制系统的设计与实现
变频水泵
恒压控制
增益调度
控制策略优化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于信息增益的自适应主题爬行策略
来源期刊 计算机应用研究 学科
关键词 主题爬行 维基百科 主题描述 自适应方法 信息增益
年,卷(期) 2012,(2) 所属期刊栏目 算法研究探讨
研究方向 页码范围 501-503
页数 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2012.02.027
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 熊忠阳 重庆大学计算机学院 135 2447 25.0 44.0
2 张玉芳 重庆大学计算机学院 125 2737 26.0 48.0
3 史艳 重庆大学计算机学院 2 19 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (12)
参考文献  (3)
节点文献
引证文献  (8)
同被引文献  (12)
二级引证文献  (6)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(6)
  • 引证文献(4)
  • 二级引证文献(2)
2018(3)
  • 引证文献(2)
  • 二级引证文献(1)
2020(4)
  • 引证文献(1)
  • 二级引证文献(3)
研究主题发展历程
节点文献
主题爬行
维基百科
主题描述
自适应方法
信息增益
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导