作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
LDA(Latent Dirichlet Allocation)在训练的过程中没有结合词向量训练,而LF-LDA(Latent Feature-LDA)在训练过程中利用Word2vec词向量改善了文档的主题分布.但是,文档用主题分布进行表示,没有结合特征词的上下文信息.为此,本文提出利用LF-LDA生成的主题向量结合Word2vec词向量,对文本进行表示.另外,文章还提出了利用LF-LDA生成的主题向量对文档进行表示.在StackOverflow短文本数据集上的分类结果表明,LF-LDA结合Word2vec的文本表示优于LDA结合Word2vec的文本表示和LF-LDA主题分布的文本表示.基于主题向量的文本表示模型优于LDA模型.
推荐文章
基于LDA和word2vec的英文作文跑题检测
作文跑题检测
向量空间模型
潜在狄利克雷分配
词语间语义关系
基于word2vec和双向LSTM的情感分类深度模型
文本分类
情感分析
双向长短时记忆循环神经网络
词向量
社交网络
基于word2vec的数字图书馆本体构建技术研究
本体构建
领域本体
概念抽取
关系抽取
数字图书馆现状
基于Word2Vec和LDA主题模型的Web服务聚类方法
Web服务
Word2Vec
LDA主题模型
K-means算法
Web服务聚类
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LF-LDA和Word2vec的文本表示模型研究
来源期刊 电子技术 学科
关键词 文本表示 LDA Word2vec LF-LDA 文本分类
年,卷(期) 2017,(7) 所属期刊栏目 电子技术研究
研究方向 页码范围 1-5
页数 5页 分类号
字数 4146字 语种 中文
DOI 10.3969/j.issn.1000-0755.2017.07.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李俊 中国科学技术大学信息科学技术学院自动化系 242 2653 26.0 41.0
2 陈磊 中国科学技术大学信息科学技术学院自动化系 65 345 10.0 15.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (62)
参考文献  (6)
节点文献
引证文献  (9)
同被引文献  (4)
二级引证文献  (1)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(4)
  • 引证文献(4)
  • 二级引证文献(0)
2019(3)
  • 引证文献(3)
  • 二级引证文献(0)
2020(3)
  • 引证文献(2)
  • 二级引证文献(1)
研究主题发展历程
节点文献
文本表示
LDA
Word2vec
LF-LDA
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子技术
月刊
1000-0755
31-1323/TN
大16开
上海市长宁区泉口路274号
4-141
1963
chi
出版文献量(篇)
5480
总下载数(次)
19
论文1v1指导