基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对大规模数据分类时计算时间长以及分类精度下降等问题, 提出使用张量分解求解LDA主题模型参数,实现对海量网络数据的采集、分类、挖掘. 该方法使用矩量法将LDA模型求解转化为低维的张量分解问题, 通过分解和反射进行参数的传递, 运用大数据平台Spark的进行分布式计算. 实验结果表明, 改进的模型参数计算方法在时间效率和困惑度方面都得到了提升, 并且分类信息更加直观, 更加适用于大规模网络数据分类工作.
推荐文章
分布式检索中基于主题的语言模型集合选择策略
分布式检索
集合选择
语言模型
主题信息
基于属性分类的分布式大数据隐私保护加密控制模型设计
属性分类
分布式大数据
隐私保护
加密控制模型
Logistic混沌映射
基于SLIQ的分布式图像分类框架的研究实现
分布式数据挖掘
医学图像
分类算法
基于分布式数据仓库的分类分析研究
数据挖掘
分布式数据仓库
分类分析
GAC-RDB
Hadoop
HBase
Hive
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于张量分解的分布式主题分类模型
来源期刊 计算机系统应用 学科
关键词 LDA主题模型 张量分解 Spark 数据分类
年,卷(期) 2018,(6) 所属期刊栏目 软件技术·算法
研究方向 页码范围 151-157
页数 7页 分类号
字数 6742字 语种 中文
DOI 10.15888/j.cnki.csa.006394
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卞艺杰 河海大学商学院 125 994 16.0 24.0
2 唐明伟 南京审计大学管理科学与工程学院 12 65 5.0 7.0
3 马年圣 河海大学商学院 2 14 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (81)
共引文献  (67)
参考文献  (14)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1951(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(1)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(5)
  • 参考文献(1)
  • 二级参考文献(4)
2004(5)
  • 参考文献(1)
  • 二级参考文献(4)
2005(4)
  • 参考文献(0)
  • 二级参考文献(4)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2009(6)
  • 参考文献(1)
  • 二级参考文献(5)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2012(14)
  • 参考文献(0)
  • 二级参考文献(14)
2013(9)
  • 参考文献(1)
  • 二级参考文献(8)
2014(5)
  • 参考文献(2)
  • 二级参考文献(3)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
LDA主题模型
张量分解
Spark
数据分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机系统应用
月刊
1003-3254
11-2854/TP
大16开
北京中关村南四街4号
82-558
1991
chi
出版文献量(篇)
10349
总下载数(次)
20
论文1v1指导