基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对微博短文本特征稀疏导致文本相似性度量不精确的问题,提出一种基于多视角的微博短文本相似度算法。根据词形相同与词义相近寻找微博短文本中的公共块,以公共块所含词项总数与公共块之间的组合顺序,构建基于公共块序列的语义相似度;利用微博短文本发布时间、转发与评论等信息来修正该语义相似度,形成新的微博短文本相似度算法,度量微博短文本之间的相似性;将新的微博短文本相似度算法融入Single‐Pass聚类算法中以检测微博话题。实验结果表明,将该算法应用于微博话题检测时,能够有效降低话题检测的平均漏检率与误检率等,提高了话题检测的质量。
推荐文章
基于文本相似度的微博网络水军发现算法
特征码
索引
文本相似度
最长子序列
属性论在文本相似度计算中的应用
相似度
属性论
属性重心剖分模型
中文短文本语法语义相似度算法
语法语义相似度
语句相似性计算
HowNet
语料库
语法分析
语义分析
相似度计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 短文本相似度研究及其在微博话题检测中的应用
来源期刊 计算机工程与设计 学科 工学
关键词 微博短文本相似度 微博话题检测 结构化信息 公共块序列 语义相似度
年,卷(期) 2015,(11) 所属期刊栏目 开发与应用
研究方向 页码范围 3128-3133
页数 6页 分类号 TP391.1
字数 5807字 语种 中文
DOI 10.16208/j.issn1000-7024.2015.11.049
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 黄贤英 重庆理工大学计算机科学与工程学院 95 349 9.0 14.0
2 陈红阳 重庆理工大学计算机科学与工程学院 3 45 3.0 3.0
3 刘英涛 重庆理工大学计算机科学与工程学院 7 94 6.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (54)
共引文献  (84)
参考文献  (8)
节点文献
引证文献  (11)
同被引文献  (53)
二级引证文献  (24)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(7)
  • 参考文献(0)
  • 二级参考文献(7)
2004(4)
  • 参考文献(0)
  • 二级参考文献(4)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(4)
  • 参考文献(0)
  • 二级参考文献(4)
2010(8)
  • 参考文献(1)
  • 二级参考文献(7)
2011(18)
  • 参考文献(1)
  • 二级参考文献(17)
2012(4)
  • 参考文献(2)
  • 二级参考文献(2)
2013(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(3)
  • 二级引证文献(0)
2018(14)
  • 引证文献(5)
  • 二级引证文献(9)
2019(10)
  • 引证文献(2)
  • 二级引证文献(8)
2020(7)
  • 引证文献(0)
  • 二级引证文献(7)
研究主题发展历程
节点文献
微博短文本相似度
微博话题检测
结构化信息
公共块序列
语义相似度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导