基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
话题检测技术在传统媒体的研究中取得了较好的效果.探讨了针对微博类的新型媒体短文本对象话题检测技术的优化及性能评价.基于微博中联系人存在的关注和粉丝等结构化信息、帖子之间转发评论等内在关联关系,提出了针对微博的MB-SinglePass话题检测算法.该算法除了考虑微博上述特点之外,还针对短文本特征稀疏的问题,利用同义词典,引入了微博特征扩展技术,丰富了特征信息.同时,针对单一使用余弦相似度、雅各比相似度和语义相似度的不足,采用了组合相似度策略.相较传统算法,MB-SinglePass算法在新浪微博实测数据集上取得了更好的性能.另外,针对相似度策略的对照实验说明采用组合相似度的效果优于单一相似度.
推荐文章
基于 LSA和结构特性的微博话题检测
微博
话题检测
文本聚类
语义空间
潜在语义分析
基于可区分语言模型的微博在线话题检测
话题检测
特征选择
微博
语言模型
可区分语言模型
基于评论树的微博社区热门话题检测方法
微博社区
热门话题
过滤
评论树
话题热度评价模型
基于时间特性的微博热门话题检测算法研究
微博
热门话题
时间因素
TimePageRank算法
用户兴趣
PageRank算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 MB-SinglePass:基于组合相似度的微博话题检测
来源期刊 计算机科学 学科 工学
关键词 微博 SinglePass 话题检测 文本相似度 同义词扩展
年,卷(期) 2012,(10) 所属期刊栏目 人工智能
研究方向 页码范围 198-202
页数 分类号 TP391
字数 6516字 语种 中文
DOI 10.3969/j.issn.1002-137X.2012.10.044
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄永忠 信息工程大学信息工程学院 41 315 11.0 16.0
2 周刚 11 115 5.0 10.0
4 熊小兵 信息工程大学信息工程学院 5 107 5.0 5.0
7 邹鸿程 信息工程大学信息工程学院 2 56 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (43)
共引文献  (191)
参考文献  (6)
节点文献
引证文献  (55)
同被引文献  (71)
二级引证文献  (159)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(8)
  • 参考文献(0)
  • 二级参考文献(8)
2004(6)
  • 参考文献(1)
  • 二级参考文献(5)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(9)
  • 参考文献(2)
  • 二级参考文献(7)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(2)
  • 参考文献(2)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(5)
  • 引证文献(5)
  • 二级引证文献(0)
2014(17)
  • 引证文献(8)
  • 二级引证文献(9)
2015(32)
  • 引证文献(9)
  • 二级引证文献(23)
2016(46)
  • 引证文献(15)
  • 二级引证文献(31)
2017(39)
  • 引证文献(8)
  • 二级引证文献(31)
2018(37)
  • 引证文献(6)
  • 二级引证文献(31)
2019(28)
  • 引证文献(2)
  • 二级引证文献(26)
2020(9)
  • 引证文献(1)
  • 二级引证文献(8)
研究主题发展历程
节点文献
微博
SinglePass
话题检测
文本相似度
同义词扩展
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
总被引数(次)
150664
论文1v1指导