基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为实现新闻热点话题的排行和发现,对新闻文本进行聚类,通过对报道频率的研究,利用热度公式计算得到新闻热点话题TOP排行榜.针对增量式聚类方法Single-Pass算法相似度公式计算代价大和特征值选择不够准确的不足提出改进方案,利用抓取的新闻语料库数据对改进算法进行实验验证与分析,实验数据与Single-Pass算法聚类结果进行对比,得到了更理想的新闻热点聚类效果,表明了算法的可行有效性.
推荐文章
基于混合聚类的微博热点话题发现方法
聚类算法
向量空间模型
话题聚类
热点话题
基于速度增长的微博热点话题发现
增长斜率
增长速度
时间二元组序列
热点发现
微博负向情感热点话题发现模型
微博
负向情感
热点分析
事件发现
一种突发性热点话题在线发现与跟踪方法
突发性热点话题
话题发现与跟踪
向量空间模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 增量式聚类的新闻热点话题发现研究
来源期刊 计算机与现代化 学科 工学
关键词 新闻热点话题 文本聚类 Single-Pass算法 热度公式
年,卷(期) 2017,(3) 所属期刊栏目 算法设计与分析
研究方向 页码范围 46-50
页数 5页 分类号 TP393
字数 4272字 语种 中文
DOI 10.3969/j.issn.1006-2475.2017.03.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (205)
参考文献  (19)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(12)
  • 参考文献(1)
  • 二级参考文献(11)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(10)
  • 参考文献(2)
  • 二级参考文献(8)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(9)
  • 参考文献(2)
  • 二级参考文献(7)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2015(5)
  • 参考文献(4)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新闻热点话题
文本聚类
Single-Pass算法
热度公式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导