基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了解决短文本稀疏性问题,提高主题模型的性能,提出了一种词向量嵌入的主题模型.首先,假设一篇文档只包含一个主题;其次,利用词向量对每一轮迭代的主题进行扩充与调整,即对每一个主题,利用一种非参数化的概率采样方法得到一些词,再用词向量找出相似词,提升该主题下相似词的权重;最后,用拉普拉斯近似主题分布,使其更好地运用在变分自动编码器训练中,从而加快训练速度.实验结果表明,本文模型训练出的主题具有较好的解释性,并优于其他主流的模型,可为短文本的主题提取提供更多的可能.在主题模型训练的过程中,利用词向量干预主题词分布可以得到较好的主题质量,并可以通过变分自动编码器加快训练速度,对自然语言处理问题的研究具有一定的创新性和参考价值.
推荐文章
基于LSTM自动编码机的短文本聚类方法
自然语言处理
短文本
聚类
长短期记忆网络
自动编码机
基于循环自动编码器的间歇过程故障监测
算法
动态建模
神经网络
LSTM
过程监测
循环自动编码器
基于降噪自动编码器及其改进模型的微博情感分析
降噪自动编码器
微博
情感分析
深度学习
基于变分自动编码器的动态主题模型
计算机神经网络
动态主题模型
变分自动编码器
动态因子图
参数
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于词向量和变分自动编码器的短文本主题模型
来源期刊 河北工业科技 学科 工学
关键词 计算机神经网络 主题模型 词向量 变分自动编码器 短文本
年,卷(期) 2018,(6) 所属期刊栏目 应用技术
研究方向 页码范围 441-447
页数 7页 分类号 TP389.1
字数 5467字 语种 中文
DOI 10.7535/hbgykj.2018yx06010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 韩立新 河海大学计算机与信息学院 47 272 9.0 15.0
2 张青 河海大学计算机与信息学院 14 33 4.0 4.0
3 勾智楠 河海大学计算机与信息学院 3 8 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (3)
参考文献  (3)
节点文献
引证文献  (4)
同被引文献  (22)
二级引证文献  (1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(2)
  • 参考文献(0)
  • 二级参考文献(2)
2016(2)
  • 参考文献(1)
  • 二级参考文献(1)
2017(2)
  • 参考文献(1)
  • 二级参考文献(1)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
计算机神经网络
主题模型
词向量
变分自动编码器
短文本
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
河北工业科技
双月刊
1008-1534
13-1226/TM
大16开
河北省石家庄市裕华东路70号
18-327
1984
chi
出版文献量(篇)
2570
总下载数(次)
4
总被引数(次)
14826
论文1v1指导