基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
互联网的飞速发展和海量数据的不断增长,使得如何快速、有效地识别当前新闻热点信息成为迫切需求。在线新闻话题发现已成为当前研究热点。对于在线环境下的新闻文本特征表示,传统向量空间模型随着数据的增长向量维度不断增长,使得数据稀疏和同名异议问题愈加明显,导致文本相似度难以准确度量。使用基于特征加权的隐含语义分析将高维、稀疏的词-文档矩阵映射到隐藏的k维语义空间,充分挖掘词、文档之间的语义信息,以提高同主题文档间的语义相似度,克服在线环境下文本稀疏性和同名异议问题。此外,对于不断增长的大规模新闻数据,传统聚类算法存在时间复杂度过高或者输入依赖等问题,难以快速、有效地得到理想结果。基于新闻报道在时间上的顺序性和相关性,提出改进的Single-pass在线增量聚类算法检测话题类,并引入话题热度值的概念来筛选当前关注度较高的热点话题。实验结果表明,该方法能够有效提高话题检测的准确率,实现基于真实新闻数据集的在线话题捕捉。
推荐文章
基于隐含语义分析的微博话题发现方法
隐含语义分析
向量空间模型
话题发现
微博
两阶段聚类
基于隐主题分析的中文微博话题发现
中文微博
话题发现
隐主题模型
文本聚类
频繁项集挖掘
一种突发性热点话题在线发现与跟踪方法
突发性热点话题
话题发现与跟踪
向量空间模型
基于事件关联网络的用户兴趣话题发现算法
话题识别
链接分析
用户兴趣
Bootstrapping算法
关联网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于隐含语义分析的在线新闻话题发现方法
来源期刊 计算机技术与发展 学科 工学
关键词 话题发现 向量空间模型 隐含语义分析 文本聚类 奇异值分解
年,卷(期) 2016,(9) 所属期刊栏目 应用开发研究
研究方向 页码范围 1-7
页数 7页 分类号 TP181
字数 8146字 语种 中文
DOI 10.3969/j.issn.1673-629X.2016.09.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩京宇 南京邮电大学计算机学院 21 87 6.0 8.0
5 武高敏 南京邮电大学计算机学院 1 10 1.0 1.0
6 张宇晨 南京邮电大学计算机学院 1 10 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (34)
共引文献  (219)
参考文献  (11)
节点文献
引证文献  (10)
同被引文献  (12)
二级引证文献  (3)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(4)
  • 参考文献(1)
  • 二级参考文献(3)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(2)
  • 二级参考文献(0)
2016(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2016(2)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(6)
  • 引证文献(4)
  • 二级引证文献(2)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
话题发现
向量空间模型
隐含语义分析
文本聚类
奇异值分解
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导