基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着微博这一新兴社交媒体的广泛应用,以微博为背景的相关研究不断涌现,其中基于微博的话题检测是当前研究的热点之一。结合微博文本的相关特点,文中提出了一种基于LDA模型和多层聚类的微博话题检测方法。首先,通过LDA模型对微博数据建模并提取特征;其次,利用改进的Single-Pass聚类和层次聚类对微博数据进行聚类,从而发现热点话题。通过在大规模微博数据上进行话题检测实验,通过LDA建模比通过TF-IDF进行特征选择和权重计算效果好;改进的Single-Pass聚类能够处理第一遍Single-Pass聚类未处理的微博,提高了初步聚类的精度,并且为下一步层次聚类减少了时间;多层聚类的聚类效果在准确率、召回率和F值三方面均比单一聚类算法的聚类效果好。显然,文中的话题检测方法是可行的,也是有效的。
推荐文章
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
基于 LSA和结构特性的微博话题检测
微博
话题检测
文本聚类
语义空间
潜在语义分析
基于混合聚类的微博热点话题发现方法
聚类算法
向量空间模型
话题聚类
热点话题
基于可区分语言模型的微博在线话题检测
话题检测
特征选择
微博
语言模型
可区分语言模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA模型和多层聚类的微博话题检测
来源期刊 计算机技术与发展 学科 工学
关键词 LDA模型 话题检测 改进的Single-Pass聚类 层次聚类
年,卷(期) 2016,(6) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 25-30,36
页数 7页 分类号 TP391
字数 5936字 语种 中文
DOI 10.3969/j.issn.1673-629X.2016.06.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张仰森 北京信息科技大学智能信息处理研究所 104 721 15.0 23.0
2 刘红兵 太原科技大学电子信息学院 13 26 2.0 5.0
3 李文坤 北京信息科技大学智能信息处理研究所 2 56 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (114)
参考文献  (10)
节点文献
引证文献  (19)
同被引文献  (45)
二级引证文献  (21)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(7)
  • 参考文献(3)
  • 二级参考文献(4)
2012(7)
  • 参考文献(3)
  • 二级参考文献(4)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(10)
  • 引证文献(10)
  • 二级引证文献(0)
2019(23)
  • 引证文献(6)
  • 二级引证文献(17)
2020(4)
  • 引证文献(0)
  • 二级引证文献(4)
研究主题发展历程
节点文献
LDA模型
话题检测
改进的Single-Pass聚类
层次聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导