基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着微博应用的迅猛发展,自动地从海量微博信息中提取出用户感兴趣的热点话题成为一个具有挑战性的研究课题.为此研究并提出了基于扩展的话题模型的中文微博热点话题抽取算法.为了解决微博信息固有的数据稀疏性问题,算法首先利用文本聚类方法将内容相关的微博消息合成为微博文档;基于微博之间的跟帖关系蕴含着话题的关联性的假设,算法对传统潜在狄利克雷分配(LDA)话题模型进行扩展以建模微博之间的跟帖关系;最后利用互信息(MI)计算被抽取出的话题的话题词汇用于热点话题推荐.为了验证扩展的话题抽取模型的有效性,实现了一个基于特定领域的中文微博热点话题挖掘的原型系统——BTopicMiner.实验结果表明:基于微博跟帖关系的扩展话题模型可以更准确地自动提取微博中的热点话题,同时利用MI度量自动计算得到的话题词汇和人工挑选的热点词汇之间的语义相似度达到75%以上.
推荐文章
基于数据挖掘技术的微博热点话题预测
数据挖掘
网络技术
微博话题
预测模型
基于速度增长的微博热点话题发现
增长斜率
增长速度
时间二元组序列
热点发现
一种热点话题算法在微博舆情系统中的应用
微博
情感分析
热点话题
微博舆情
微博负向情感热点话题发现模型
微博
负向情感
热点分析
事件发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于特定领域的中文微博热点话题挖掘系统BTopicMiner
来源期刊 计算机应用 学科 工学
关键词 数据挖掘 信息检索 微博 话题模型 文本聚类 互信息
年,卷(期) 2012,(8) 所属期刊栏目 典型应用
研究方向 页码范围 2346-2349
页数 分类号 TP311.52
字数 5789字 语种 中文
DOI 10.3724/SP.J.1087.2012.02346
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李劲 湖北民族学院信息工程学院 37 219 8.0 13.0
3 向军 湖北民族学院信息工程学院 30 126 6.0 10.0
4 张华 湖北民族学院信息工程学院 21 143 6.0 11.0
7 吴浩雄 湖北民族学院信息工程学院 3 70 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (57)
同被引文献  (110)
二级引证文献  (150)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(6)
  • 引证文献(5)
  • 二级引证文献(1)
2014(34)
  • 引证文献(17)
  • 二级引证文献(17)
2015(37)
  • 引证文献(10)
  • 二级引证文献(27)
2016(37)
  • 引证文献(9)
  • 二级引证文献(28)
2017(44)
  • 引证文献(8)
  • 二级引证文献(36)
2018(22)
  • 引证文献(6)
  • 二级引证文献(16)
2019(19)
  • 引证文献(1)
  • 二级引证文献(18)
2020(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
数据挖掘
信息检索
微博
话题模型
文本聚类
互信息
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
总被引数(次)
209512
论文1v1指导