原文服务方: 科技与创新       
摘要:
论坛是互联网中最活跃的部分,蕴涵着丰富的信息.论坛采集是对论坛信息检索和挖掘的重要基础,然而传统的广度优先算法不能有效的获取论坛信息.针对论坛的深层链接、存在大量功能链接和无效链接及内容重复链接等特点,本文提出了一种论坛采集算法,能有效的解决以上难题.经过实验表明,论坛采集的覆盖率和有效率明显优于传统算法,并且应用在中科院计算所舆情监测平台上取得了良好的效果.
推荐文章
网络视听节目监管系统数据采集关键技术研究
网络视听节目
主题爬虫
广度优先搜索
多进程调度
变速器故障诊断数据采集关键技术研究
故障诊断
数据采集
数据同步
主控实现
振动分析
EPON关键技术研究
EPON
DBA
测距
保护
VoLTE关键技术研究
VoLTE
RoHC
SPS
TTIB
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 WWW论坛采集关键技术研究
来源期刊 科技与创新 学科
关键词 信息检索 论坛采集 舆情监测
年,卷(期) 2010,(24) 所属期刊栏目
研究方向 页码范围 106-107,119
页数 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.2095-6835.2010.24.041
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘金刚 首都师范大学计算机联合实验室 94 784 14.0 24.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (30)
参考文献  (1)
节点文献
引证文献  (4)
同被引文献  (15)
二级引证文献  (2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(2)
  • 引证文献(1)
  • 二级引证文献(1)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
信息检索
论坛采集
舆情监测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
科技与创新
半月刊
2095-6835
14-1369/N
大16开
2014-01-01
chi
出版文献量(篇)
41653
总下载数(次)
0
总被引数(次)
202805
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导