基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
融合新闻命名实体、新闻标题、新闻重要段落、文本语义等多特征影响,提出基于多特征融合文本聚类的新闻话题发现模型.模型根据新闻的多特征影响,提出一种多特征融合文本聚类方法.该方法针对新闻标题、新闻重要段落等特征因素构建向量空间模型及相似度算法,基于潜在狄利克雷分配模型构建主题空间模型及相似度算法,针对命名实体构建命名实体模型及相似度算法,并将三种相似度算法形成最优融合.基于多特征融合文本聚类方法,模型改进了用于新闻话题发现的Single-Pass算法.实验是在真实新闻数据集上开展的,实验结果表明:该模型有效地提高了新闻话题发现的准确率、召回率和综合评价指标,并具有一定的自适应能力.
推荐文章
基于多特征融合的财经新闻话题检测研究
财经新闻
话题检测
多特征融合
凝聚层次聚类
K最近邻
基于图聚类的汉越双语新闻话题发现
汉越双语
事件要素
话题发现
图聚类
基于藏文新闻文本话题检测的聚类算法研究
聚类算法
种子话题
藏文新闻文本
话题检测
增量式聚类的新闻热点话题发现研究
新闻热点话题
文本聚类
Single-Pass算法
热度公式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多特征融合文本聚类的新闻话题发现模型
来源期刊 国防科技大学学报 学科 工学
关键词 新闻话题 多特征融合 潜在狄利克雷分配 向量空间模型 主题空间模型
年,卷(期) 2017,(3) 所属期刊栏目 计算机科学与技术·管理科学与工程
研究方向 页码范围 85-90
页数 6页 分类号 TP391
字数 4779字 语种 中文
DOI 10.11887/j.cn.201703014
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杨小平 中国人民大学信息学院 84 967 15.0 30.0
2 车蕾 中国人民大学信息学院 17 42 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (40)
参考文献  (7)
节点文献
引证文献  (9)
同被引文献  (46)
二级引证文献  (18)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(3)
  • 参考文献(1)
  • 二级参考文献(2)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(2)
  • 参考文献(1)
  • 二级参考文献(1)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(18)
  • 引证文献(5)
  • 二级引证文献(13)
2020(6)
  • 引证文献(1)
  • 二级引证文献(5)
研究主题发展历程
节点文献
新闻话题
多特征融合
潜在狄利克雷分配
向量空间模型
主题空间模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
国防科技大学学报
双月刊
1001-2486
43-1067/T
大16开
湖南省长沙市开福区德雅路109号
42-98
1956
chi
出版文献量(篇)
3593
总下载数(次)
5
总被引数(次)
31889
论文1v1指导