基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
当今时代,网络舆情传播速度快、影响力大,而话题检测在网络舆情监管中有着不可替代的作用.针对传统方法提取文本特征不完整和特征维度过高的问题,本文提出了基于时间衰减因子的LDA&&Word2Vec文本表示模型,将LDA模型的隐含主题特征和Word2Vec模型的语义特征进行加权融合,并引入了时间衰减因子,同时起到了降维和提高文本特征完整度的作用.同时,本文又提出了Single-Pass-SOM组合聚类模型,该模型解决了SOM模型需要设定初始神经元的问题,提高了话题聚类的精度.实验结果表明,本文提出的文本表示模型和文本聚类方法较传统方法拥有更好的话题检测效果.
推荐文章
孤立点预处理和 Single-Pass 聚类结合的微博话题检测方法
微博
热点话题
增量聚类
孤立点
话题检测
基于改进的Single-pass算法的新闻热点的发现
新闻热点
话题发现
聚类算法
基于层叠模型的话题检测方法研究
话题检测
相似话题
向量空间模型
层叠模型
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多特征融合Single-Pass-SOM组合模型的话题检测
来源期刊 计算机系统应用 学科
关键词 话题检测 文本表示 SOM聚类 Single-Pass聚类 Single-Pass-SOM
年,卷(期) 2020,(7) 所属期刊栏目 软件技术·算法
研究方向 页码范围 245-250
页数 6页 分类号
字数 4178字 语种 中文
DOI 10.15888/j.cnki.csa.007508]
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘念 中国科学院沈阳计算技术研究所 9 169 5.0 9.0
2 焦艳菲 6 4 2.0 2.0
3 张琳琳 中国科学院沈阳计算技术研究所 23 155 6.0 12.0
4 孟祥茹 中国科学院沈阳计算技术研究所 4 8 1.0 2.0
5 李丰男 中国科学院大学计算机控制与工程学院 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (12)
共引文献  (48)
参考文献  (6)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2017(4)
  • 参考文献(1)
  • 二级参考文献(3)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
话题检测
文本表示
SOM聚类
Single-Pass聚类
Single-Pass-SOM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导