原文服务方: 计算机应用研究       
摘要:
为了解决传统的文本主题模型对微博主题挖掘准确率低及不考虑主题之间关联的问题,针对中文微博语料本身的特点,分析LDA(latent Dirichlet allocation)和HMM(hidden Markov model)的优缺点,提出了微博主题挖掘模型MB-HL(microblog-HMM&LDA).该模型用逐条微博作为处理单元,建立分布主题—词语矩阵并进行优化,通过LDA模型对微博用户不同的行为建模并提取特征,利用HMM模型强大的时序状态建模能力弥补LDA在主题相关性上的不足,采用Gibbs采样进行推理求解.在真实的新浪微博数据上对比实验表明MB-HL模型能提高近9%主题关键词的准确度,并能有效地发现主题之间的关联关系.
推荐文章
基于权重微博链的改进LDA微博主题模型
短文本
主题挖掘
微博链
潜在狄利克雷分布
perplexity
主题概率模型在微博主题挖掘方面的研究综述
微博
主题概率模型
主题
主题提取
社团发现
基于mixtureLDA的微博主题挖掘
微博
主题挖掘
微博类型
mixtureLDA
结合微博关注特性的UF_AT模型用户兴趣挖掘研究
微博
用户关注特性
作者主题模型
兴趣挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MB-HL模型的微博主题挖掘研究
来源期刊 计算机应用研究 学科
关键词 微博 主题挖掘 潜在狄利克雷分布模型 隐马尔可夫模型 MB-HL模型 Gibbs采样
年,卷(期) 2018,(11) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3298-3301,3306
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2018.11.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 郑山红 长春工业大学计算机科学与工程学院 60 249 8.0 12.0
2 李万龙 长春工业大学计算机科学与工程学院 66 472 9.0 19.0
3 刘凯 长春工业大学计算机科学与工程学院 6 25 2.0 5.0
4 蒋权 长春工业大学计算机科学与工程学院 4 9 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
微博
主题挖掘
潜在狄利克雷分布模型
隐马尔可夫模型
MB-HL模型
Gibbs采样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导