基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
提出一种基于状态自动机的突发特征检测算法,针对微博数据长度小,语言不规范,噪声大,数据量大的特点,优化预处理过程和状态自动机模型参数;提出一种突发话题聚类算法,对特征词的词频向量表示进行改进,并引入基于词激活力(WAF)的词法特征,使得聚类效果更加准确,得到的突发话题可读性更强.最后通过实验方法验证了算法的可行性.
推荐文章
基于时间特性的微博热门话题检测算法研究
微博
热门话题
时间因素
TimePageRank算法
用户兴趣
PageRank算法
微博突发话题检测方法研究
微博
突发话题
滑动窗口
语义相似度
空间向量模型
话题检测与跟踪
基于动态窗口的微博突发话题检测方法
微博
突发话题
动态窗口
词对加速度
非负矩阵分解
基于可区分语言模型的微博在线话题检测
话题检测
特征选择
微博
语言模型
可区分语言模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于自动机的微博在线突发话题检测算法
来源期刊 软件 学科 工学
关键词 文本检索 突发话题检测 话题聚类
年,卷(期) 2012,(12) 所属期刊栏目 理论计算机科学
研究方向 页码范围 109-113
页数 5页 分类号 TP391.3
字数 5995字 语种 中文
DOI 10.3969/j.issn.1003-6970.2012.12.028
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐蔚然 北京邮电大学模式识别实验室 22 369 9.0 19.0
2 谢乾龙 北京邮电大学信息与通信工程学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (10)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(0)
  • 二级引证文献(3)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(3)
  • 引证文献(0)
  • 二级引证文献(3)
2018(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
文本检索
突发话题检测
话题聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
总被引数(次)
23629
论文1v1指导