作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 结合中文信息处理技术,设计一个网络舆情监控系统;针对网络舆情挖掘研究中存在的问题,提出了一种K-means改进算法,实现Web挖掘基础上的文本聚类与主题发现.方法 构建一个基于聚类分析的网络舆情监控系统,并详细介绍系统各个模块用到的关键技术;提出了一种K-means改进算法,对K-means算法中的关键环节(聚类初始值的选择和孤立点的剔除)进行了改进.结果 设计的系统能通过对网页、论坛、博客、新闻评论等网络资源的精确采集,并结合网页净化、中文分词、向量模型建立、特征选择、降维处理,文本聚类等中文信息处理技术,实现对网络舆情的监测;改进算法的总体思路是要求用户输入簇的初始个数k和最大值kmax,由改进算法在计算过程中自动计算出聚类的结果数k.结论 设计了一个基于聚类分析的网络舆情监控系统;提出了一种K-means改进算法.具体算法实施及将这些关键技术整合实现成一套自动化的网络舆情信息采集、分析、监测与预警系统,是网络舆情挖掘研究工作的下一步重点.
推荐文章
基于微博的网络舆情分析系统设计
向量空间模型
TF-IDF
话题发现
舆情分析
网络舆情分析系统的研究与设计
网络舆情
网页文本结构化
文本分类
文本聚类
基于大数据的网络舆情分析系统
大数据
网络舆情
舆情分析
Hadoop
HDFS
MapReduce
基于大数据的网络舆情监测系统的设计与实现
网络舆情
大数据
数据采集
数据分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于聚类分析的网络舆情监控系统的设计
来源期刊 宝鸡文理学院学报(自然科学版) 学科 工学
关键词 舆情监控 K-means 文本聚类 主题发现
年,卷(期) 2011,(4) 所属期刊栏目 秦岭药用植物资源开发与利用国际研讨会部分论文选登
研究方向 页码范围 40-44
页数 分类号 TP311.1
字数 2475字 语种 中文
DOI 61-1290/N.20111215.1631.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄美璇 黎明职业大学机电工程系 12 35 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (63)
共引文献  (81)
参考文献  (11)
节点文献
引证文献  (12)
同被引文献  (17)
二级引证文献  (27)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(10)
  • 参考文献(0)
  • 二级参考文献(10)
2007(14)
  • 参考文献(2)
  • 二级参考文献(12)
2008(14)
  • 参考文献(2)
  • 二级参考文献(12)
2009(8)
  • 参考文献(2)
  • 二级参考文献(6)
2010(5)
  • 参考文献(5)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2014(4)
  • 引证文献(3)
  • 二级引证文献(1)
2015(5)
  • 引证文献(3)
  • 二级引证文献(2)
2016(8)
  • 引证文献(3)
  • 二级引证文献(5)
2017(6)
  • 引证文献(0)
  • 二级引证文献(6)
2018(5)
  • 引证文献(0)
  • 二级引证文献(5)
2019(7)
  • 引证文献(1)
  • 二级引证文献(6)
2020(3)
  • 引证文献(1)
  • 二级引证文献(2)
研究主题发展历程
节点文献
舆情监控
K-means
文本聚类
主题发现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
宝鸡文理学院学报(自然科学版)
季刊
1007-1261
61-1290/N
大16开
陕西省宝鸡市宝光路44号
1979
chi
出版文献量(篇)
1784
总下载数(次)
13
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导