原文服务方: 计算机应用研究       
摘要:
针对传统的话题检测方法在处理大规模微博短文本时出现的降维能力不足和语义信息丢失等问题,提出基于潜在语义分析和结构特性相结合的微博话题检测方法。根据微博的对话属性和传播模型,首先要合并微博讨论树扩展微博文本,创建基于潜在语义分析(LSA)的微博文本模型以解决数据稀疏性问题,最后结合时间信息给出新的相似度计算方法,并采用凝聚层次聚类法检测微博话题。实验结果表明,提出的方法降低了话题检测的错失率,大大提高了微博话题检测的性能。
推荐文章
基于时间特性的微博热门话题检测算法研究
微博
热门话题
时间因素
TimePageRank算法
用户兴趣
PageRank算法
基于评论树的微博社区热门话题检测方法
微博社区
热门话题
过滤
评论树
话题热度评价模型
基于可区分语言模型的微博在线话题检测
话题检测
特征选择
微博
语言模型
可区分语言模型
基于速度增长的微博热点话题发现
增长斜率
增长速度
时间二元组序列
热点发现
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于 LSA和结构特性的微博话题检测
来源期刊 计算机应用研究 学科
关键词 微博 话题检测 文本聚类 语义空间 潜在语义分析
年,卷(期) 2015,(9) 所属期刊栏目 系统应用开发
研究方向 页码范围 2720-2723
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.09.037
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曹春萍 上海理工大学光电信息与计算机工程学院 52 244 8.0 13.0
2 崔海船 上海理工大学光电信息与计算机工程学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (73)
共引文献  (348)
参考文献  (10)
节点文献
引证文献  (4)
同被引文献  (30)
二级引证文献  (31)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(3)
  • 参考文献(0)
  • 二级参考文献(3)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(6)
  • 参考文献(0)
  • 二级参考文献(6)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(8)
  • 参考文献(0)
  • 二级参考文献(8)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2009(7)
  • 参考文献(0)
  • 二级参考文献(7)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(19)
  • 参考文献(3)
  • 二级参考文献(16)
2012(9)
  • 参考文献(6)
  • 二级参考文献(3)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(6)
  • 引证文献(2)
  • 二级引证文献(4)
2017(10)
  • 引证文献(2)
  • 二级引证文献(8)
2018(12)
  • 引证文献(0)
  • 二级引证文献(12)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
微博
话题检测
文本聚类
语义空间
潜在语义分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导