基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在大数据和移动互联网的时代背景下,舆情信息的迅猛增长为其采集与分析带来挑战.运用分布式计算技术,有利于对领域海量主题舆情的快速采集与分析.研究主题舆情采集与分析关键技术,包括主题舆情采集技术、领域词典和中文分词,探讨分布式计算环境下的主题舆情采集与舆情数据分析,并利用面向对象的分析与设计方法,基于开源爬虫设计并实现了一个分布式主题舆情采集与分析系统.利用4个爬虫节点进行分布式采集,相比传统采集模式,该系统的平均采集速度提升了2.74倍.
推荐文章
面向舆情采集的分布式缓存系统设计
舆情采集
分布式检索
分布式缓存系统
网络舆情监控系统中主题网络爬虫的研究与实现
网络舆情监控系统
主题网络爬虫
信息采集
分布式主题爬虫的设计与实现
主题爬虫
分布式
遗传算法
搜索引擎
分布式手机信令数据采集与分析技术研究
智能手机
分布式计算
分布式数据库
Spark技术
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 分布式主题舆情采集与分析系统设计
来源期刊 软件导刊 学科 工学
关键词 分布式 主题舆情 信息采集 开源爬虫
年,卷(期) 2020,(11) 所属期刊栏目 软件设计、开发与应用
研究方向 页码范围 116-119
页数 4页 分类号 TP319
字数 语种 中文
DOI 10.11907/rjdk.201708
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张文学 23 105 7.0 9.0
2 董富江 14 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (126)
共引文献  (27)
参考文献  (20)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(8)
  • 参考文献(0)
  • 二级参考文献(8)
2013(13)
  • 参考文献(0)
  • 二级参考文献(13)
2014(24)
  • 参考文献(0)
  • 二级参考文献(24)
2015(13)
  • 参考文献(2)
  • 二级参考文献(11)
2016(21)
  • 参考文献(0)
  • 二级参考文献(21)
2017(16)
  • 参考文献(4)
  • 二级参考文献(12)
2018(10)
  • 参考文献(7)
  • 二级参考文献(3)
2019(6)
  • 参考文献(6)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
分布式
主题舆情
信息采集
开源爬虫
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导