基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
话题检测可以及时发现互联网舆情热点和突发性事件,并可对话题进行持续跟踪,从而实时掌握舆情事件动向。文中提出了一种基于聚类的改进话题检测和跟踪算法。首先,对文本的特征向量进行改进,增加了基于句子主干的主干向量。然后对每个检测到的话题提取两个中心向量,一个是基本中心向量,另一个是基于主干向量提炼的主干中心向量。在此基础上再通过计算每个文本与中心向量之间的距离进行聚类分析,保证话题中各个文本之间的内聚性。同时基于主题词抽取,在主题词的基础上计算话题之间的主题相关性,有效地实现了子话题检测功能,从而提高了话题检测和跟踪的准确性。通过对10大网站5个频道超过两周数据量的测试,结果表明此方法在一定程度上提高了话题检测和跟踪的正确率,并具有一定的适应性和推广性。
推荐文章
知网的话题更新与跟踪算法研究
自然语言处理
话题跟踪
新闻报道
知网
话题更新
动态文本流中的话题线索检测算法
动态文本流
话题线索检测
语义相关度
消息划分
即时通信工具
基于粒度商空间下的话题识别与跟踪研究
相容商空间
粒度
话题识别
舆情
基于改进的softmax回归模型的话题跟踪算法
类别信息
特征权重
softmax回归
话题跟踪
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 改进的话题检测和跟踪算法研究
来源期刊 计算机技术与发展 学科 工学
关键词 话题检测和跟踪 聚类算法 特征向量 网络舆情
年,卷(期) 2014,(9) 所属期刊栏目 智能、算法、系统工程
研究方向 页码范围 84-88
页数 5页 分类号 TP301.6
字数 4629字 语种 中文
DOI 10.3969/j.issn.1673-629X.2014.09.019
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 许少华 东北石油大学计算机与信息技术学院 52 329 11.0 15.0
2 肖红 东北石油大学计算机与信息技术学院 42 180 7.0 10.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (40)
共引文献  (91)
参考文献  (12)
节点文献
引证文献  (7)
同被引文献  (25)
二级引证文献  (13)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(9)
  • 参考文献(1)
  • 二级参考文献(8)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(4)
  • 参考文献(4)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(4)
  • 引证文献(4)
  • 二级引证文献(0)
2018(8)
  • 引证文献(2)
  • 二级引证文献(6)
2019(5)
  • 引证文献(0)
  • 二级引证文献(5)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
话题检测和跟踪
聚类算法
特征向量
网络舆情
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导