原文服务方: 现代电子技术       
摘要:
为充分利用大数据时代的海量数据,提出一种基于新浪微博的公交系统数据采集及分析方法。通过Web Crawler从新浪微博抓取所需时空范围内的公交微博,分析公交微博发布的时间与空间分布规律;随后采用KMP算法统计并剔除冗余转发及回复微博,提取并分析公交相关的热点话题;基于中科院ICTCLAS算法进行中文分词处理,删除停用词后统计词频,生成关键词的词云。最后通过南京市范围内的8913条公交微博进行实例验证与分析,结果表明,该方法可以从海量的微博数据中提取公交相关数据并进行分析,分析数据量大且有时效性,分析结果可为公交系统管理的优化与改善、公交政策的制定提供数据支撑。
推荐文章
新浪微博数据爬取研究
新浪微博
数据爬取
微博爬虫
Python
新浪健康微博的文本分析
新浪微博
健康传播
文本分析
基于微博数据采集的W eb信息集成系统研究
Web信息集成
微博数据采集
气候变化
信息推送
新浪微博的体育新闻传播研究
新浪微博
体育新闻
传播
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于新浪微博的公交系统数据采集及分析
来源期刊 现代电子技术 学科
关键词 微博 公交系统 数据抓取 中文分词 大数据
年,卷(期) 2015,(9) 所属期刊栏目 电子技术应用
研究方向 页码范围 159-162
页数 4页 分类号 TN911-34|U491.14
字数 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 谷文林 河海大学商学院 38 169 8.0 11.0
2 任敏 河海大学商学院 3 25 3.0 3.0
3 华雪东 东南大学交通学院 11 134 6.0 11.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (64)
参考文献  (8)
节点文献
引证文献  (3)
同被引文献  (19)
二级引证文献  (6)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(5)
  • 参考文献(0)
  • 二级参考文献(5)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(6)
  • 引证文献(2)
  • 二级引证文献(4)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
微博
公交系统
数据抓取
中文分词
大数据
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
现代电子技术
半月刊
1004-373X
61-1224/TN
大16开
1977-01-01
chi
出版文献量(篇)
23937
总下载数(次)
0
总被引数(次)
135074
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导