基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
LDA作为一种常用的主题模型,在文本挖掘中作为特征选择的方法被广泛应用。但随着互联网中短文本信息的逐渐增多,短文本代表性词少的特点使得LDA对于短文本的主题挖掘不一定能够达到理想效果,这给LDA的应用带来了巨大挑战。为了探究LDA主题模型对短文本的分类效果,基于LDA,对长文本和短文本进行分类,对比分类效果,判断LDA对于短文本的适用性。
推荐文章
基于自身特征扩展的短文本分类方法
短文本
稀疏
信号弱
扩展
离散度
相关度
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
CNN-ELM混合短文本分类模型
文本分类
卷积神经网络
极速学习机
集成学习在短文本分类中的应用研究
短文本分类
机器学习
深度学习
集成学习
Bagging
Stacking
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA的长短文本分类比较
来源期刊 数字技术与应用 学科 工学
关键词 LDA 主题模型 文本分类 短文本
年,卷(期) 2016,(10) 所属期刊栏目 学术论坛
研究方向 页码范围 230-230
页数 1页 分类号 TP181
字数 617字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王海林 山西财经大学信息管理学院 11 37 4.0 6.0
2 张雅君 山西财经大学信息管理学院 4 7 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (33)
参考文献  (4)
节点文献
引证文献  (4)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(4)
  • 参考文献(1)
  • 二级参考文献(3)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
研究主题发展历程
节点文献
LDA
主题模型
文本分类
短文本
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数字技术与应用
月刊
1007-9416
12-1369/TN
16开
天津市
6-251
1983
chi
出版文献量(篇)
20434
总下载数(次)
106
总被引数(次)
35701
论文1v1指导