基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为实现新闻热点话题的排行和发现,对新闻文本进行聚类,通过对报道频率的研究,利用热度公式计算得到新闻热点话题TOP排行榜.针对增量式聚类方法Single-Pass算法相似度公式计算代价大和特征值选择不够准确的不足提出改进方案,利用抓取的新闻语料库数据对改进算法进行实验验证与分析,实验数据与Single-Pass算法聚类结果进行对比,得到了更理想的新闻热点聚类效果,表明了算法的可行有效性.
推荐文章
基于改进 TF*PDF 算法的网络新闻热点话题检测和跟踪
Single-Pass聚类
话题识别
热点话题
热度分析
基于隐含语义分析的在线新闻话题发现方法
话题发现
向量空间模型
隐含语义分析
文本聚类
奇异值分解
基于SSDKmeans算法的微博热点话题发现研究
话题发现
文本聚类
微博短文本
频繁集
网络舆情热点话题检测聚类算法研究
数据聚类
聚类算法
网络舆情
热点话题检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 增量式聚类的新闻热点话题发现研究
来源期刊 计算机与现代化 学科 工学
关键词 新闻热点话题 文本聚类 Single-Pass算法 热度公式
年,卷(期) 2017,(3) 所属期刊栏目 算法设计与分析
研究方向 页码范围 46-50
页数 5页 分类号 TP393
字数 4272字 语种 中文
DOI 10.3969/j.issn.1006-2475.2017.03.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (205)
参考文献  (19)
节点文献
引证文献  (3)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(6)
  • 参考文献(0)
  • 二级参考文献(6)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(12)
  • 参考文献(1)
  • 二级参考文献(11)
2007(7)
  • 参考文献(1)
  • 二级参考文献(6)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(10)
  • 参考文献(2)
  • 二级参考文献(8)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(11)
  • 参考文献(2)
  • 二级参考文献(9)
2012(7)
  • 参考文献(2)
  • 二级参考文献(5)
2013(9)
  • 参考文献(2)
  • 二级参考文献(7)
2014(6)
  • 参考文献(3)
  • 二级参考文献(3)
2015(5)
  • 参考文献(4)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新闻热点话题
文本聚类
Single-Pass算法
热度公式
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导