基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为获得更好的事件发现和代表性新闻抽取性能,引入数据集代表点采样聚类的视角,研究实现了一种事件发现及表示的集成分析方法.对于给定的新闻流数据,首先引入信息支撑度定义新闻间关系权重和事件关系权重,并通过引入双层近邻传播算法的迭代构建整体时间流上的单向事件内容支撑度网络,实现代表性新闻的分层增量采样,进一步考虑以最大相似度划分策略实现代表性新闻上的整体新闻流数据聚类.实验结果表明,相比于现有相关方法,新方法在大规模新闻流数据上具有显著的计算效率,可提取出新闻流中极有代表性的新闻,以及获得更好的新闻文档聚类质量,其热点事件发现结果与权威机构评选的重大新闻有极高吻合度.
推荐文章
增量式聚类的新闻热点话题发现研究
新闻热点话题
文本聚类
Single-Pass算法
热度公式
面向新闻评论的短文本增量聚类算法
舆情分析
短文本
增量聚类算法
向量空间模型
神经网络
一种面向网络话题发现的增量文本聚类算法
话题发现
文本聚类
增量聚类
准确度
ICIT算法
一种基于网格的增量聚类算法
增量
聚类
网格
数据挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 增量采样聚类驱动的新闻事件发现
来源期刊 智能系统学报 学科
关键词 新闻流数据 事件发现 代表性新闻 增量采样 信息支撑度 近邻传播 事件网络 分层聚类
年,卷(期) 2020,(6) 所属期刊栏目 自然语言处理与理解|Natural Language Processing and Comprehension
研究方向 页码范围 1175-1184
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.11992/tis.201912037
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (71)
共引文献  (80)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(4)
  • 参考文献(0)
  • 二级参考文献(4)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(13)
  • 参考文献(1)
  • 二级参考文献(12)
2013(10)
  • 参考文献(1)
  • 二级参考文献(9)
2014(7)
  • 参考文献(2)
  • 二级参考文献(5)
2015(4)
  • 参考文献(0)
  • 二级参考文献(4)
2016(4)
  • 参考文献(1)
  • 二级参考文献(3)
2017(3)
  • 参考文献(2)
  • 二级参考文献(1)
2018(4)
  • 参考文献(4)
  • 二级参考文献(0)
2019(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新闻流数据
事件发现
代表性新闻
增量采样
信息支撑度
近邻传播
事件网络
分层聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
论文1v1指导