基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
主题模型(topic models)被广泛应用在信息分类和检索领域.这些模型通过参数估计从文本集合中提取一个低维的多项式分布集合,用于捕获词之间的相关信息,称为主题(topic).针对模型参数学习过程对主题数目的指定和主题分布初始值非常敏感的问题,作者用图的形式阐述了LDA(Latent Dirichlet Allocation)模型中主题产生的过程,提出并证明当主题之间的相似度最小时模型最优的理论,基于该理论,提出了一种基于密度的自适应最优LDA模型选择方法.实验证明该方法可以在不需要人工调试主题数目的情况下,用相对少的迭代,自动找到最优的主题结构.
推荐文章
一种快速最优自适应频率校准电路
自适应
频率校准
快速
数模混合
最优算法
一种基于感知模型的自适应数字水印方法
数字水印
感知模型
噪声可见度函数
鲁棒性
一种噪声密度检测自适应选择策略的滤波算法
椒盐噪声
密度检测
统计域值
中值滤波
噪声检测
一种自适应烟标字符提取方法
支持向量机
背景重构
N-Otsu法
最优二值化
字符提取
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种基于密度的自适应最优LDA模型选择方法
来源期刊 计算机学报 学科 工学
关键词 主题模型 主题 LDA 密度
年,卷(期) 2008,(10) 所属期刊栏目 研究论文
研究方向 页码范围 1780-1787
页数 8页 分类号 TP18
字数 6470字 语种 中文
DOI 10.3321/j.issn:0254-4164.2008.10.012
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张勇东 中国科学院计算技术研究所虚拟现实技术实验室 47 927 15.0 29.0
5 李锦涛 中国科学院计算技术研究所虚拟现实技术实验室 115 2894 31.0 50.0
9 曹娟 中国科学院计算技术研究所虚拟现实技术实验室 7 186 4.0 7.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (3)
节点文献
引证文献  (156)
同被引文献  (161)
二级引证文献  (931)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(2)
  • 引证文献(2)
  • 二级引证文献(0)
2010(6)
  • 引证文献(6)
  • 二级引证文献(0)
2011(14)
  • 引证文献(11)
  • 二级引证文献(3)
2012(45)
  • 引证文献(17)
  • 二级引证文献(28)
2013(66)
  • 引证文献(14)
  • 二级引证文献(52)
2014(109)
  • 引证文献(12)
  • 二级引证文献(97)
2015(109)
  • 引证文献(12)
  • 二级引证文献(97)
2016(161)
  • 引证文献(17)
  • 二级引证文献(144)
2017(190)
  • 引证文献(21)
  • 二级引证文献(169)
2018(191)
  • 引证文献(25)
  • 二级引证文献(166)
2019(155)
  • 引证文献(15)
  • 二级引证文献(140)
2020(38)
  • 引证文献(3)
  • 二级引证文献(35)
研究主题发展历程
节点文献
主题模型
主题
LDA
密度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
相关基金
国家重点基础研究发展计划(973计划)
英文译名:National Basic Research Program of China
官方网址:http://www.973.gov.cn/
项目类型:
学科类型:农业
论文1v1指导