作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着新浪微博用户的不断增长,微博网站成为很多人获取信息的平台.但是微博是一种特殊的文本,其字数受到严格限制,传统的主题模型并不能很好地分析微博的内容.本文提出了一个基于LDA的微博生成模型RT-LDA来解决微博字数受限的问题.模型采用吉布斯抽样法来推导,不仅能准确地挖掘每条微博的主题,还能归纳出用户关注的主题分布情况.在真实数据集上的实验表明,RT-LDA模型能很好地对微博进行主题挖掘.
推荐文章
基于权重微博链的改进LDA微博主题模型
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
基于UR-LDA的微博主题挖掘
微博
主题挖掘
UR-LDA
吉布斯抽样
MB-HL模型的微博主题挖掘研究
微博
主题挖掘
潜在狄利克雷分布模型
隐马尔可夫模型
MB-HL模型
Gibbs采样
基于mixtureLDA的微博主题挖掘
微博
主题挖掘
微博类型
mixtureLDA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种面向微博主题挖掘的改进LDA模型
来源期刊 华东师范大学学报(自然科学版) 学科 工学
关键词 新浪微博 文本挖掘 RT-LDA 吉布斯抽样
年,卷(期) 2013,(6) 所属期刊栏目 计算机科学
研究方向 页码范围 93-101
页数 9页 分类号 TP39
字数 5181字 语种 中文
DOI 10.3969/j.issn.1000-5641.2013.06.011
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 江红 华东师范大学计算中心 53 553 11.0 22.0
2 谢昊 华东师范大学计算中心 1 50 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (139)
参考文献  (7)
节点文献
引证文献  (50)
同被引文献  (127)
二级引证文献  (123)
1951(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(2)
  • 引证文献(2)
  • 二级引证文献(0)
2015(13)
  • 引证文献(10)
  • 二级引证文献(3)
2016(12)
  • 引证文献(10)
  • 二级引证文献(2)
2017(28)
  • 引证文献(8)
  • 二级引证文献(20)
2018(52)
  • 引证文献(9)
  • 二级引证文献(43)
2019(49)
  • 引证文献(7)
  • 二级引证文献(42)
2020(17)
  • 引证文献(4)
  • 二级引证文献(13)
研究主题发展历程
节点文献
新浪微博
文本挖掘
RT-LDA
吉布斯抽样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
华东师范大学学报(自然科学版)
双月刊
1000-5641
31-1298/N
16开
上海市中山北路3663号
4-359
1955
chi
出版文献量(篇)
2430
总下载数(次)
5
总被引数(次)
17499
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导