基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
为弥补目前国内学者只做单一算法研究且语料单一的缺陷,使用Word2vec词向量模型结合支持向量机(SVM)、卷积神经网络(CNN)和长短期记忆网络(LSTM)3种不同分类算法,研究了不同中文文本分类问题,包括微博语料的多维细粒度情感分类、酒店评价的倾向性分析和新闻文本的主题分类.将3种分类模型在不同文本中的分类效果进行对比,结果显示这3种算法对于不同的中文分类效果各有不同:不同维度的词向量对准确率等评价指标影响很大;支持向量机模型更适合于细粒度的微博情感分类;卷积神经网络、长短期记忆网络算法更适合于噪声小、文本长且规范的新闻主题分类任务.分类粒度会对算法准确性产生影响,粒度越细、任务越复杂,算法准确性越低.
推荐文章
中文文本分类研究
文本分类
k 近邻
支持向量机
最大熵
中文文本分类系统的设计与实现
文本分类
向量空间模型
特征项选择
权重
不同情境下中文文本分类模型的表现及选择?
中文文本
文本分类
数据挖掘
情报分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 多种算法对不同中文文本分类效果比较研究
来源期刊 软件导刊 学科 工学
关键词 文本分类 Word2vec 支持向量机 卷积神经网络 长短期记忆网络
年,卷(期) 2019,(5) 所属期刊栏目 软件理论与方法
研究方向 页码范围 73-78
页数 6页 分类号 TP3-0
字数 6096字 语种 中文
DOI 10.11907/rjdk.182489
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 田大钢 上海理工大学管理学院 54 437 12.0 19.0
2 陈慧 上海理工大学管理学院 3 5 1.0 2.0
3 冯成刚 上海理工大学管理学院 2 13 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (52)
共引文献  (73)
参考文献  (11)
节点文献
引证文献  (4)
同被引文献  (12)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(1)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(3)
  • 参考文献(1)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2008(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(7)
  • 参考文献(1)
  • 二级参考文献(6)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(4)
  • 参考文献(0)
  • 二级参考文献(4)
2013(5)
  • 参考文献(1)
  • 二级参考文献(4)
2014(4)
  • 参考文献(2)
  • 二级参考文献(2)
2015(5)
  • 参考文献(0)
  • 二级参考文献(5)
2016(3)
  • 参考文献(0)
  • 二级参考文献(3)
2017(3)
  • 参考文献(1)
  • 二级参考文献(2)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
2020(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
Word2vec
支持向量机
卷积神经网络
长短期记忆网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件导刊
月刊
1672-7800
42-1671/TP
16开
湖北省武汉市
38-431
2002
chi
出版文献量(篇)
9809
总下载数(次)
57
总被引数(次)
30383
论文1v1指导