基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
文本分类是自然语言处理的基础任务,文本中的特征稀疏性和提取特征所用的神经网络影响后续的分类效果.针对文本中的特征信息不足以及传统模型上下文依赖关系方面不足的问题,提出经过TF-IDF加权的词向量和LDA主题模型相融合,利用双向门控循环神经网络层(BiGRU)充分提取文本深度信息特征的分类方法.该方法主要使用的数据集是天池比赛新闻文本分类数据集,首先用Word2vec和LDA模型分别在语料库中训练词向量,Word2vec经过TF-IDF进行加权所得的词向量再与LDA训练的经过最大主题概率扩展的词向量进行简单拼接,拼接后得到文本矩阵,将文本矩阵输入到BiGRU神经网络中,分别从前后两个反方向提取文本深层次信息的特征向量,最后使用softmax函数进行多分类,根据输出的概率判断所属的类别.与现有的常用文本分类模型相比,准确率、F1值等评价指标都有了较高的提升.
推荐文章
基于LDA-wSVM模型的文本分类研究
文本分类
潜在狄利克雷分布
支持向量机
权重计算
吉普斯抽样
基于BiGRU-attention神经网络的文本情感分类模型
文本情感分类
注意力机制
双向门控循环神经网络
基于LDA模型的文本分类研究
文本分类
潜在狄利克雷分配(LDA)模型
Gibbs抽样
贝叶斯统计理论
基于大数据挖掘技术的文本分类研究
大规模文本数据
高维特征
大数据挖掘技术
文本分类器
分类精度
分类时间
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于LDA和BiGRU的文本分类
来源期刊 计算机技术与发展 学科 工学
关键词 LDA主题模型 BiGRU Word2vec 深度学习 文本分类
年,卷(期) 2022,(4) 所属期刊栏目 人工智能技术
研究方向 页码范围 15-20
页数 6页 分类号 TP391.1|TP183
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2022.04.003
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
LDA主题模型
BiGRU
Word2vec
深度学习
文本分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导