基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
考虑网络事件的时间距离,基于半结构化网页中不同位置特征项重要程度的不同,提出改进的single-pass文本聚类算法single-pass*,优势在于对Web文本不同位置特征项的加权处理,仅需计算新文档与同类别种子文档间的相似度。实验结果表明,相比single-pass,改进算法极大减少了漏检率和错检率,降低了由于新文本流内文档进行相似度计算导致系统性能的下降,平均提高Web文本聚类效率40%。将聚类后的Web文本应用于网络舆情分析,进行主题关注度分析和话题热度特性分析。
推荐文章
基于改进的Single-pass算法的新闻热点的发现
新闻热点
话题发现
聚类算法
基于频繁模式挖掘的网络舆情热点发现技术研究
网络舆情
舆情热点发现
频繁模式挖掘
窗口裁剪
基于改进的 single-pass 网络舆情话题发现研究
网络舆情热点
single-pass算法
文本聚类
孤立点预处理和 Single-Pass 聚类结合的微博话题检测方法
微博
热点话题
增量聚类
孤立点
话题检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于Single-Pass的网络舆情热点发现算法
来源期刊 电子科技大学学报 学科 工学
关键词 舆情分析 single-pass 文本聚类 话题发现
年,卷(期) 2015,(4) 所属期刊栏目 Rootkit 研究综述
研究方向 页码范围 599-604
页数 6页 分类号 TP312
字数 4559字 语种 中文
DOI 10.3969/j.issn.1001-0548.2015.04.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 格桑多吉 西藏大学藏文信息技术研究中心 36 231 8.0 14.0
2 元昌安 广西师范学院科学计算与智能信息处理广西高校重点实验室 121 1400 21.0 33.0
3 杨燕 西南交通大学信息科学与技术学院 97 1192 16.0 32.0
4 乔少杰 西南交通大学信息科学与技术学院 20 339 10.0 18.0
5 张小松 电子科技大学大数据研究中心 36 272 8.0 15.0
6 康健 西南交通大学信息科学与技术学院 11 57 4.0 7.0
7 韩楠 西南交通大学生命科学与工程学院 5 198 5.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (45)
共引文献  (108)
参考文献  (7)
节点文献
引证文献  (29)
同被引文献  (57)
二级引证文献  (22)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(6)
  • 参考文献(0)
  • 二级参考文献(6)
2007(7)
  • 参考文献(0)
  • 二级参考文献(7)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(6)
  • 参考文献(2)
  • 二级参考文献(4)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(9)
  • 引证文献(8)
  • 二级引证文献(1)
2017(9)
  • 引证文献(7)
  • 二级引证文献(2)
2018(12)
  • 引证文献(8)
  • 二级引证文献(4)
2019(14)
  • 引证文献(5)
  • 二级引证文献(9)
2020(7)
  • 引证文献(1)
  • 二级引证文献(6)
研究主题发展历程
节点文献
舆情分析
single-pass
文本聚类
话题发现
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子科技大学学报
双月刊
1001-0548
51-1207/T
大16开
成都市成华区建设北路二段四号
62-34
1959
chi
出版文献量(篇)
4185
总下载数(次)
13
总被引数(次)
36111
论文1v1指导