基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
Python平台开发了网络新闻爬虫,通过实验对比常用的网页数据获取方法,本文提出一种适合新闻网页的解析方式,克服了获取动态网页时源码不完整、单一方法解析网页效率低下等弊端,满足了新闻网页抓取、解析、结构化和入库存储等需求.并将新浪新闻中心作为网络新闻数据采集的目标,分析发现新浪新闻近几年的发展情况.此外,利用词频统计等手段对十九大会议新闻进行分析,直观地反映了十九大的核心人物、关键党派、热点话题变化等重要信息.
推荐文章
面向热点新闻事件的地图快速制作框架与实现
新闻事件
模块化
中文分词
在线地图
探析报纸新闻与网络新闻写作的差异
新闻写作
网络新闻
差异
基于Python的网络新闻爬虫与检索
爬虫
信息检索
Scrapy
Solr
数据去重
网络热点新闻烂尾现象的受众心理分析
心理需求
热点新闻
烂尾现象
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向网络新闻的爬虫开发与热点新闻事件分析
来源期刊 测绘与空间地理信息 学科 地球科学
关键词 网络爬虫 网络新闻 事件分析 十九大
年,卷(期) 2019,(3) 所属期刊栏目 基金项目专栏
研究方向 页码范围 100-103,108
页数 5页 分类号 P208
字数 3774字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘海砚 信息工程大学地理空间信息学院 70 486 11.0 18.0
2 陈思雯 信息工程大学地理空间信息学院 3 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (30)
共引文献  (28)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(8)
  • 参考文献(4)
  • 二级参考文献(4)
2016(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
网络新闻
事件分析
十九大
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
测绘与空间地理信息
月刊
1672-5867
23-1520/P
大16开
哈尔滨市南岗区测绘路32号
14-5
1978
chi
出版文献量(篇)
11361
总下载数(次)
46
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导