基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对新闻数据流事件检测算法在实时性、准确率等方面存在的问题,提出一种面向新闻数据流的在线事件检测方法.事件的发生往往伴随着构成该事件的特征(即关键词)在相应时间段内出现的频率明显上升,将这些特征称为突发特征.运用分布拟合检验检测构成新闻数据流的特征在某一时间段内新闻报道中出现频率的分布是否发生明显变化,并进一步利用左边检验确认该时间段内的所有突发特征.分析突发特征的相关性,采用进化谱聚类算法将相关性较高的突发特征聚类在一起构成事件.在路透社新闻数据集第一卷上应用了本算法,验证了该方法能够有效地发现突发特征,并实时地检测出发生的事件,检测出的事件同实际事件有很高的符合度.
推荐文章
在线数据流的连续限制查询算法
持续限制查询
警告触发
网络日志
在线数据流
算法
面向数据流的多任务多核在线学习算法
多任务多核学习
在线学习
流数据
支持向量机
基于多数据流分析的木马检测方法
数据流
Bagging
木马检测
C4.5决策树
在线BCI高速数据流的可预测并发实时传输
在线BCI
高速EEG数据流
并发
自适应单向模糊推理
生产—消费协同
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 新闻数据流的在线事件检测
来源期刊 浙江大学学报(工学版) 学科 工学
关键词 在线事件检测 进化谱聚类 假设检验 新闻数据流
年,卷(期) 2011,(6) 所属期刊栏目 自动化技术、计算机技术
研究方向 页码范围 1006-1012
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.3785/j.issn.1008-973X.2011.06.007
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (8)
共引文献  (14)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
在线事件检测
进化谱聚类
假设检验
新闻数据流
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
浙江大学学报(工学版)
月刊
1008-973X
33-1245/T
大16开
杭州市浙大路38号
32-40
1956
chi
出版文献量(篇)
6865
总下载数(次)
6
总被引数(次)
81907
相关基金
国家科技支撑计划
英文译名:
官方网址:http://kjzc.jhgl.org/
项目类型:重大项目
学科类型:能源
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导