基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在训练集和测试集数据量大的情况下,半监督递归自编码(semi-supervisedrecursiveautoencoder,Semi-Supervised RAE)文本情感分析模型会出现网络训练速度缓慢和模型的测试结果输出速率缓慢等问题.因此,提出采用并行化处理框架,在大训练集情况下,基于"分而治之"的方法,先将数据集进行分块划分并将各个数据块输入Map节点计算每个数据块的误差,利用缓冲区汇总所有的块误差,Reduce节点从缓冲区读取这些块误差以计算优化目标函数;然后,调用L-BFGS(limited-memory Broyden-Fletcher-Goldfarb-Shanno)算法调整参数,更新后的参数集再次加载到模型中,重复以上训练步骤逐步优化目标函数直至收敛,从而得到最优参数集;在测试集大的情况下,模型的初始化参数为上述步骤得到的参数集,Map节点对各句子进行编码得到其向量表示,然后暂存在缓冲区中;最后,在Reduce节点中分类器利用各语句的向量表示计算各自语句的情感标签.实例验证表明:在标准语料库MR(movie review)下本文算法精确度为77.0%,与原始算法的精确度(77.3%)几乎相同;在大数据量训练集下,训练时间在一定程度上随着计算节点的增加而大量减少.
推荐文章
基于主题流与深度学习的情感分析算法
NLP
情感分析
深度学习
主题流
基于深度学习的社交网络平台细粒度情感分析
情感分析
深度学习
降噪自动编码器
社交网络平台
基于多任务深度学习的文本情感原因分析
情感原因分析
多任务学习
深度学习
文本挖掘
文本情感分析的深度学习方法
情感分析
深度学习
LSTM
MultiGRU
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度学习的文本情感分析并行化算法
来源期刊 西南交通大学学报 学科 工学
关键词 半监督递归自编码 文本情感分析 并行计算
年,卷(期) 2019,(3) 所属期刊栏目
研究方向 页码范围 647-654
页数 8页 分类号 TP391
字数 4515字 语种 中文
DOI 10.3969/j.issn.0258-2724.20160948
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 翟东海 西南交通大学信息科学与技术学院 45 285 9.0 14.0
2 侯佳林 西南交通大学信息科学与技术学院 3 13 2.0 3.0
3 刘月 西南交通大学信息科学与技术学院 4 15 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (19)
共引文献  (218)
参考文献  (13)
节点文献
引证文献  (1)
同被引文献  (15)
二级引证文献  (15)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(6)
  • 参考文献(2)
  • 二级参考文献(4)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(5)
  • 参考文献(3)
  • 二级参考文献(2)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(1)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
2020(14)
  • 引证文献(0)
  • 二级引证文献(14)
研究主题发展历程
节点文献
半监督递归自编码
文本情感分析
并行计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
西南交通大学学报
双月刊
0258-2724
51-1277/U
大16开
四川省成都市二环路北一段
62-104
1954
chi
出版文献量(篇)
3811
总下载数(次)
4
总被引数(次)
51589
论文1v1指导