基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对增量式聚类初始时话题模型不够充分和准确,随处理报道数量增加,误检与漏检的累积效应被放大的问题,提出了周期分类和Single-Pass聚类相结合的话题识别与跟踪方法.首先采用增量式聚类算法进行话题识别与跟踪,当新闻文本每积累到一定程度之后,对已经聚类的报道进行周期分类,使话题簇精度提高,从而提高后续话题识别与跟踪精度.实验表明这种方法是有效的,能够降低漏检率与错检率,减少归一化错误识别代价.
推荐文章
孤立点预处理和 Single-Pass 聚类结合的微博话题检测方法
微博
热点话题
增量聚类
孤立点
话题检测
基于改进的Single-pass算法的新闻热点的发现
新闻热点
话题发现
聚类算法
孤立点预处理和 Single-Pass 聚类结合的微博话题检测方法
微博
热点话题
增量聚类
孤立点
话题检测
基于Single-Pass的在线话题检测改进算法
网络舆情
Single-Pass
相似度计算
食品安全
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 周期分类和Single-Pass聚类相结合的话题识别与跟踪方法
来源期刊 北京交通大学学报 学科 工学
关键词 话题识别与跟踪 增量聚类 文本分类 k-最近邻方法分类
年,卷(期) 2009,(5) 所属期刊栏目 计算机工程与数据挖掘
研究方向 页码范围 85-89
页数 5页 分类号 TP391
字数 4213字 语种 中文
DOI
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (121)
参考文献  (4)
节点文献
引证文献  (50)
同被引文献  (93)
二级引证文献  (206)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(3)
  • 参考文献(2)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2010(1)
  • 引证文献(1)
  • 二级引证文献(0)
2011(4)
  • 引证文献(4)
  • 二级引证文献(0)
2012(7)
  • 引证文献(6)
  • 二级引证文献(1)
2013(10)
  • 引证文献(5)
  • 二级引证文献(5)
2014(20)
  • 引证文献(6)
  • 二级引证文献(14)
2015(22)
  • 引证文献(9)
  • 二级引证文献(13)
2016(39)
  • 引证文献(5)
  • 二级引证文献(34)
2017(49)
  • 引证文献(8)
  • 二级引证文献(41)
2018(48)
  • 引证文献(4)
  • 二级引证文献(44)
2019(44)
  • 引证文献(1)
  • 二级引证文献(43)
2020(12)
  • 引证文献(1)
  • 二级引证文献(11)
研究主题发展历程
节点文献
话题识别与跟踪
增量聚类
文本分类
k-最近邻方法分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京交通大学学报
双月刊
1673-0291
11-5258/U
大16开
北京西直门外上园村3号
1975
chi
出版文献量(篇)
3626
总下载数(次)
7
总被引数(次)
38401
论文1v1指导