基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为了将已有的英文主题向量模型更好地应用于中文的主题向量训练, 并且解决主题个数事先确定的缺点.本文将原有模型中, 文档向量和词向量线性相加的方式改为内积的方式, 并结合文档向量、字向量和词向量三者一起训练主题向量.当得到主题向量后通过聚类方法将相似的主题聚集在一起, 以此来确定主题个数.实验表明, 该方法训练出的主题词的相关性较原有模型和传统模型有所提升, 并且能够获得较为合理的主题个数, 同时, 还能够得到词向量, 主题向量和文档向量.
推荐文章
融合词向量特征的双词主题模型
主题模型
潜在狄利克雷分配
短文本
双词主题模型
词向量
吉布斯采样
基于向量空间模型的多主题Web文本分类方法
向量空间模型
文本分类
多主题
数据挖掘
主题联合词向量模型
自然语言处理
词向量
主题模型
神经网络
哈夫曼树
结合主题模型词向量的CNN文本分类
Word2vec
LDA
文本分类
卷积神经网络
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 结合字词向量的主题向量模型
来源期刊 电子测量技术 学科 工学
关键词 主题模型 字向量 主题向量 词向量 文档向量 字词嵌入
年,卷(期) 2019,(3) 所属期刊栏目 理论与算法
研究方向 页码范围 49-53
页数 5页 分类号 TP183|TN01
字数 语种 中文
DOI 10.19651/j.cnki.emt.1802050
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
主题模型
字向量
主题向量
词向量
文档向量
字词嵌入
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测量技术
半月刊
1002-7300
11-2175/TN
大16开
北京市东城区北河沿大街79号
2-336
1977
chi
出版文献量(篇)
9342
总下载数(次)
50
总被引数(次)
46785
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导