基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为满足当前高校学生舆情监督的工作需要,针对传统网络舆情采集系统的舆情信息采集效率低下、质量差等问题,设计和开发了一套基于爬虫技术与语义分析的网络舆情采集系统.该系统通过主题网络爬虫对互联网上感兴趣的资源数据进行爬取,同时利用语义分析中的向量空间模型(VSM)算法对采集到的网页数据进行进一步过滤,充分保证所采集到的舆情数据的质量.系统的各项性能试验测试结果表明,文中所设计的系统能够按照用户需求在保证效率和质量的情况下,较好地完成互联网舆情信息采集,验证了系统的可行性.
推荐文章
基于网络爬虫的舆情信息采集系统设计与实现
网络爬虫
网络舆情
舆情采集
基于网络爬虫的森林经营知识采集系统研建
森林经理学
森林经营知识
知识库
知识采集
网络爬虫
基于大数据的网络舆情分析系统
大数据
网络舆情
舆情分析
Hadoop
HDFS
MapReduce
基于微博的网络舆情分析系统设计
向量空间模型
TF-IDF
话题发现
舆情分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于爬虫技术和语义分析的网络舆情采集系统设计
来源期刊 电子设计工程 学科
关键词 网络爬虫 广度优先搜索 语义分析 向量空间模型 舆情采集
年,卷(期) 2021,(14) 所属期刊栏目 计算机技术与应用|Computer Technology Application
研究方向 页码范围 56-60
页数 5页 分类号 TP391.3
字数 语种 中文
DOI 10.14022/j.issn1674-6236.2021.14.013
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
网络爬虫
广度优先搜索
语义分析
向量空间模型
舆情采集
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子设计工程
半月刊
1674-6236
61-1477/TN
大16开
西安市高新区高新路25号瑞欣大厦10A室
52-142
1994
chi
出版文献量(篇)
14564
总下载数(次)
54
总被引数(次)
54366
论文1v1指导