基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主题模型在自然语言处理领域受到了越来越多的关注.在该领域中,主题可以看成是词项的概率分布.主题模型通过词项在文档级的共现信息抽取出语义相关的主题集合,并能够将词项空间中的文档变换到主题空间,得到文档在低维空间中的表达.作者从主题模型的起源隐性语义索引出发,对概率隐性语义索引以及LDA等在主题模型发展中的重要阶段性工作进行了介绍和分析,着重描述这些工作之间的关联性.LDA作为一个概率生成模型,很容易被扩展成其它形式的概率模型.作者对由LDA派生出的各种模型作了粗略分类,并选择了各类的代表性模型简单介绍.主题模型中最重要的两组参数分别是各主题下的词项概率分布和各文档的主题概率分布,作者对期望最大化算法在主题模型参数估计中的使用进行了分析,这有助于更深刻理解主题模型发展中各项工作的联系.
推荐文章
基于自然语言处理的Web内容过滤模型
自然语言处理
Web
内容过滤
基于自然语言处理的知识检索算法研究
自然语言处理
知识检索
半监督算法
自然语言与机器学习
人工智能
机器学习
自然语言处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 自然语言处理中主题模型的发展
来源期刊 计算机学报 学科 工学
关键词 自然语言处理 主题模型 隐性语义索引 LDA 期望最大化算法 Gibbs采样
年,卷(期) 2011,(8) 所属期刊栏目 综论
研究方向 页码范围 1423-1436
页数 分类号 TP391
字数 13404字 语种 中文
DOI 10.3724/SP.J.1016.2011.01423
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王厚峰 北京大学计算语言学研究所北京大学计算语言学教育部重点实验室 32 1161 12.0 32.0
2 徐戈 北京大学计算语言学研究所北京大学计算语言学教育部重点实验室 1 339 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (20)
共引文献  (164)
参考文献  (8)
节点文献
引证文献  (339)
同被引文献  (300)
二级引证文献  (603)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(2)
  • 参考文献(1)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(7)
  • 参考文献(1)
  • 二级参考文献(6)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(3)
  • 参考文献(3)
  • 二级参考文献(0)
2011(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2012(17)
  • 引证文献(17)
  • 二级引证文献(0)
2013(38)
  • 引证文献(32)
  • 二级引证文献(6)
2014(64)
  • 引证文献(45)
  • 二级引证文献(19)
2015(84)
  • 引证文献(33)
  • 二级引证文献(51)
2016(125)
  • 引证文献(54)
  • 二级引证文献(71)
2017(172)
  • 引证文献(59)
  • 二级引证文献(113)
2018(200)
  • 引证文献(53)
  • 二级引证文献(147)
2019(173)
  • 引证文献(39)
  • 二级引证文献(134)
2020(69)
  • 引证文献(7)
  • 二级引证文献(62)
研究主题发展历程
节点文献
自然语言处理
主题模型
隐性语义索引
LDA
期望最大化算法
Gibbs采样
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导