原文服务方: 计算机应用研究       
摘要:
针对微博话题检测中需要解决的高维数据、噪声信息以及话题的快速演化等主要问题,提出一个有效的微博在线话题检测模型——可区分语言模型(discriminative language model,DLM).该模型首先选择微博数据的可区分特征子空间,接着利用一元语言模型实现微博话题的在线检测.实验表明,在MACRO_F1和AVG_CDET等指标上,DLM明显优于现有模型,DLM能准确及时发现微博话题.
推荐文章
基于 LSA和结构特性的微博话题检测
微博
话题检测
文本聚类
语义空间
潜在语义分析
基于评论树的微博社区热门话题检测方法
微博社区
热门话题
过滤
评论树
话题热度评价模型
基于时间特性的微博热门话题检测算法研究
微博
热门话题
时间因素
TimePageRank算法
用户兴趣
PageRank算法
基于SOM聚类的微博话题发现
话题发现
词向量模型
文本相似度
短文本
SOM聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于可区分语言模型的微博在线话题检测
来源期刊 计算机应用研究 学科
关键词 话题检测 特征选择 微博 语言模型 可区分语言模型
年,卷(期) 2014,(12) 所属期刊栏目 算法研究探讨
研究方向 页码范围 3539-3542
页数 4页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2014.12.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张彬连 吉首大学软件服务外包学院 41 114 5.0 8.0
2 黄云 吉首大学软件服务外包学院 10 88 3.0 9.0
4 颜一鸣 吉首大学软件服务外包学院 23 214 5.0 14.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (139)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (10)
二级引证文献  (21)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(2)
  • 引证文献(1)
  • 二级引证文献(1)
2017(5)
  • 引证文献(0)
  • 二级引证文献(5)
2018(5)
  • 引证文献(0)
  • 二级引证文献(5)
2019(9)
  • 引证文献(0)
  • 二级引证文献(9)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
话题检测
特征选择
微博
语言模型
可区分语言模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
论文1v1指导