基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
信息时代的发展让越来越多的新闻事件充斥人们的生活,对于一件特定的新闻事件,目前已有很多算法可以帮助人们进行事件追踪和发现.提出一种CDW算法,帮助读者对于一件具有多个版本描述的新闻事件进行多个不同版本的发现.这个算法将文档集映射到话题层,通过提取每个话题的流行词,以得到文档集中具有高区分度的特征.然后根据这些特征对文档集进行聚类,最后得到事件的多个版本.通过在2个实际数据集上进行实验,实验结果表明,该算法与以往的相关算法相比是十分有效的.
推荐文章
多特征融合文本聚类的新闻话题发现模型
新闻话题
多特征融合
潜在狄利克雷分配
向量空间模型
主题空间模型
基于事件多要素模型的新闻主题句抽取
新闻事件
信息抽取
多要素模型
新闻主题句
多源文本下结合实体的事件发现方法ESP
事件发现
事件核心实体
多源文本
文本聚类
基于事件句关联的新闻主题模型构建方法
事件句关联
LDA
新闻主题模型
E-LDA
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于文本的新闻事件多版本发现模型
来源期刊 智能系统学报 学科 工学
关键词 多版本事件 高区分度 聚类模型 话题分析
年,卷(期) 2012,(4) 所属期刊栏目
研究方向 页码范围 307-314
页数 8页 分类号 TP18
字数 6904字 语种 中文
DOI 10.3969/j.issn.1673-4785.201111014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张岩 北京大学教育部机器感知重点实验室 155 1896 24.0 39.0
2 肖融 北京大学教育部机器感知重点实验室 2 7 2.0 2.0
3 孔亮 北京大学教育部机器感知重点实验室 2 4 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (48)
参考文献  (6)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (2)
1972(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2014(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
多版本事件
高区分度
聚类模型
话题分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
智能系统学报
双月刊
1673-4785
23-1538/TP
大16开
哈尔滨市南岗区南通大街145-1号楼
2006
chi
出版文献量(篇)
2770
总下载数(次)
11
总被引数(次)
12401
论文1v1指导