基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对海量文本信息的挖掘与处理是目前文本挖掘领域的一个热点问题,LDA模型是文本挖掘领域中应用广泛的一种主流模型.LDA模型能够通过快速学习和训练,检测出文本集中潜在的主题词.传统算法对速度和内存优化并不明显.文章从几个不同的方面阐述了LDA模型及其扩展模型在处理大规模文本数据时的应用,从参数估计、在线学习和并行优化方面进行了比对,对其中在线模型进行了实验验证,引入狄利克雷参数、BP信念传播算法,在几组数据集上进行了实验,分析其性能.
推荐文章
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
基于优化密度的耦合空间LDA文本聚类算法研究
文本聚类
耦合空间模型
LDA主题模型
密度
阈值
大规模短文本的快速话题发现方法与评价研究
短文本
话题发现
词共现
社团发现
基于WMF_LDA主题模型的文本相似度计算
词语语义
词语合并
词性筛选
文本相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA模型的大规模文本挖掘算法研究
来源期刊 软件 学科 工学
关键词 主题模型 潜在狄利克雷分布 在线LDA模型 BP信念传播算法 参数估计
年,卷(期) 2020,(12) 所属期刊栏目 基金项目论文
研究方向 页码范围 58-63
页数 6页 分类号 TP39
字数 语种 中文
DOI 10.3969/j.issn.1003-6970.2020.12.014
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (80)
共引文献  (201)
参考文献  (10)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(2)
  • 参考文献(0)
  • 二级参考文献(2)
1990(3)
  • 参考文献(0)
  • 二级参考文献(3)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(1)
  • 二级参考文献(2)
2003(8)
  • 参考文献(0)
  • 二级参考文献(8)
2004(9)
  • 参考文献(0)
  • 二级参考文献(9)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(7)
  • 参考文献(0)
  • 二级参考文献(7)
2009(6)
  • 参考文献(0)
  • 二级参考文献(6)
2010(5)
  • 参考文献(1)
  • 二级参考文献(4)
2011(5)
  • 参考文献(1)
  • 二级参考文献(4)
2012(5)
  • 参考文献(1)
  • 二级参考文献(4)
2013(6)
  • 参考文献(1)
  • 二级参考文献(5)
2014(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(3)
  • 参考文献(0)
  • 二级参考文献(3)
2016(7)
  • 参考文献(2)
  • 二级参考文献(5)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主题模型
潜在狄利克雷分布
在线LDA模型
BP信念传播算法
参数估计
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件
月刊
1003-6970
12-1151/TP
16开
北京市3108信箱
1979
chi
出版文献量(篇)
9374
总下载数(次)
40
总被引数(次)
23629
论文1v1指导