基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于文本内容的隐含语义分析建立在线主题演化计算模型,通过追踪不同时间片内主题的变化趋势进行主题演化分析.将Latent Dirichlet Allocation(LDA)模型扩展到在线文本流,建立并实现了在线LDA模型;利用前一时间片的后验概率影响当前时间片的先验概率来维持主题间的连续性;根据改进的增量Gibbs算法进行推理,获取主题-词和文档-主题的概率分布,利用Kullback Leibler(KL)相对熵来衡量主题之间的相似度,从而发现主题演化中的"主题遗传"和"主题变异".实验结果表明,该模型能从互联网语料中找出主题的演化趋势,具有良好的效果.
推荐文章
一种结合主题模型的推荐算法
推荐算法
矩阵分解
隐式狄利克雷分布
KL散度
主题模型
基于权重微博链的改进LDA微博主题模型
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
一种基于泛化的在线分类规则挖掘算法
在线分类
概念层次
决策树
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于LDA的在线主题演化挖掘模型
来源期刊 计算机科学 学科 工学
关键词 主题模型 LDA 演化 舆情
年,卷(期) 2010,(11) 所属期刊栏目
研究方向 页码范围 156-159,193
页数 分类号 TP310
字数 6021字 语种 中文
DOI 10.3969/j.issn.1002-137X.2010.11.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 贾焰 国防科学技术大学计算机学院 117 2188 23.0 43.0
2 周斌 国防科学技术大学计算机学院 52 1325 19.0 35.0
3 梁政 国防科学技术大学计算机学院 2 104 2.0 2.0
4 崔凯 国防科学技术大学计算机学院 1 68 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (36)
共引文献  (143)
参考文献  (9)
节点文献
引证文献  (68)
同被引文献  (129)
二级引证文献  (275)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(4)
  • 参考文献(0)
  • 二级参考文献(4)
2001(5)
  • 参考文献(0)
  • 二级参考文献(5)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(8)
  • 参考文献(1)
  • 二级参考文献(7)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(5)
  • 参考文献(4)
  • 二级参考文献(1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(7)
  • 引证文献(5)
  • 二级引证文献(2)
2013(11)
  • 引证文献(6)
  • 二级引证文献(5)
2014(24)
  • 引证文献(12)
  • 二级引证文献(12)
2015(32)
  • 引证文献(12)
  • 二级引证文献(20)
2016(48)
  • 引证文献(7)
  • 二级引证文献(41)
2017(64)
  • 引证文献(10)
  • 二级引证文献(54)
2018(65)
  • 引证文献(9)
  • 二级引证文献(56)
2019(70)
  • 引证文献(5)
  • 二级引证文献(65)
2020(22)
  • 引证文献(2)
  • 二级引证文献(20)
研究主题发展历程
节点文献
主题模型
LDA
演化
舆情
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导