原文服务方: 计算机应用研究       
摘要:
社交网络尤其是微博中含有大量的短文本.短文本不同于传统的文本,其携带的语义特征信息密度低,很难对其进行准确的主题挖掘.针对这一问题,提出根据微博发布时间与原创、转发、评论微博等社交行为信息分配权重,使用背景知识丰富语义特征的微博链结构与基于此改进的LDA主题模型.实验结果表明,相比于标准的LDA模型,本模型的perplexity值更低,即具有较低的预测不确定度.
推荐文章
MB-HL模型的微博主题挖掘研究
微博
主题挖掘
潜在狄利克雷分布模型
隐马尔可夫模型
MB-HL模型
Gibbs采样
基于微博标签和LDA的微博主题提取算法
微博
主题提取
LDA
微博标签
一种面向微博主题挖掘的改进LDA模型
新浪微博
文本挖掘
RT-LDA
吉布斯抽样
基于PBTM的海量微博主题发现
主题模型
主题发现
PBTM
吉布斯采样
分布式计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于权重微博链的改进LDA微博主题模型
来源期刊 计算机应用研究 学科
关键词 短文本 主题挖掘 微博链 潜在狄利克雷分布 perplexity
年,卷(期) 2016,(7) 所属期刊栏目 算法研究与探讨
研究方向 页码范围 2018-2021
页数 4页 分类号 TP399|TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2016.07.021
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李鹏 12 71 4.0 8.0
2 李星 12 55 4.0 7.0
3 何赞园 10 41 4.0 6.0
4 李英乐 7 80 4.0 7.0
5 于岩 4 60 4.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (59)
共引文献  (932)
参考文献  (6)
节点文献
引证文献  (19)
同被引文献  (51)
二级引证文献  (8)
1951(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(11)
  • 参考文献(0)
  • 二级参考文献(11)
2006(12)
  • 参考文献(0)
  • 二级参考文献(12)
2007(10)
  • 参考文献(0)
  • 二级参考文献(10)
2008(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(10)
  • 引证文献(8)
  • 二级引证文献(2)
2019(9)
  • 引证文献(5)
  • 二级引证文献(4)
2020(4)
  • 引证文献(2)
  • 二级引证文献(2)
研究主题发展历程
节点文献
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导