基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于狄利克雷过程混合模型( DPMM)这一非参数贝叶斯生成模型,从语义的角度入手,结合其自动确定聚类个数的特性进行话题检测,运用了聚类个数K值由大到小变化的采样策略,通过逐层递进的形式获取到较为准确的K值,并在此基础上对语义聚类的词频特性加以分析,引入一组名词实体作为“热点特征词”来引导聚类过程,从而给出了DPMM半监督模型。实验结果表明,所给出的话题检测方法在TDT4语料上取得了较好的检测性能。
推荐文章
扩展DPMM模型在短文本主题识别中的应用
话题识别
混合模型
扩展耿氏过程
流数据
静态短文本
基于话题相似性改进的K-means新闻话题聚类
K-means算法
新闻话题检测
舆情监督
文本相似性
话题覆盖率
基于多特征融合的财经新闻话题检测研究
财经新闻
话题检测
多特征融合
凝聚层次聚类
K最近邻
基于藏文新闻文本话题检测的聚类算法研究
聚类算法
种子话题
藏文新闻文本
话题检测
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于半监督DPMM的新闻话题检测
来源期刊 郑州大学学报(理学版) 学科 工学
关键词 话题检测 狄利克雷过程 Gibbs采样 幂律特性 名词实体
年,卷(期) 2016,(3) 所属期刊栏目
研究方向 页码范围 63-68
页数 6页 分类号 TP391.1
字数 4039字 语种 中文
DOI 10.13705/j.issn.1671-6841.2016070
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 袁方 河北大学计算机教学部 55 1249 17.0 34.0
5 王煜 河北大学计算机科学与技术学院 21 336 10.0 18.0
6 刘宇 河北大学数学与信息科学学院 11 69 5.0 8.0
7 姚冬冬 河北大学计算机科学与技术学院 1 4 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (100)
共引文献  (191)
参考文献  (17)
节点文献
引证文献  (4)
同被引文献  (5)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1970(1)
  • 参考文献(0)
  • 二级参考文献(1)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1973(5)
  • 参考文献(1)
  • 二级参考文献(4)
1974(3)
  • 参考文献(1)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(4)
  • 参考文献(1)
  • 二级参考文献(3)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(4)
  • 参考文献(0)
  • 二级参考文献(4)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(6)
  • 参考文献(1)
  • 二级参考文献(5)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2005(6)
  • 参考文献(0)
  • 二级参考文献(6)
2006(12)
  • 参考文献(0)
  • 二级参考文献(12)
2007(10)
  • 参考文献(1)
  • 二级参考文献(9)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(8)
  • 参考文献(2)
  • 二级参考文献(6)
2011(6)
  • 参考文献(0)
  • 二级参考文献(6)
2012(5)
  • 参考文献(2)
  • 二级参考文献(3)
2013(5)
  • 参考文献(2)
  • 二级参考文献(3)
2014(3)
  • 参考文献(2)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
话题检测
狄利克雷过程
Gibbs采样
幂律特性
名词实体
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
郑州大学学报(理学版)
季刊
1671-6841
41-1338/N
大16开
郑州市高新技术开发区科学大道100号
36-191
1962
chi
出版文献量(篇)
2278
总下载数(次)
0
总被引数(次)
9540
论文1v1指导