基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于短文本特征较少,传统的机器学习方法直接应用到短文本分类上,准确率往往不高.新闻标题相较于一般的短文本来说特征更少,在分类过程中难以提高准确率.首先采用3种方式对新闻标题的特征进行扩展,包括采用word2vec的方法寻找新闻标题中每个词在语义空间最相近的词,将最相近的词作为标题扩展词;采用fp-growth方法挖掘外部语料库的频繁项对新闻标题进行扩展;字向量和词向量两种标题表达方式扩展语义信息.其次提出了深度神经决策森林的分类算法.实验结果表明使用字词向量的双路卷积神经网络相对于单一词向量的卷积神经网络特征提取能力更强;使用深度神经决策森林算法在扩展后新闻标题验证集上的分类准确率达82.2%,比仅采用双路卷积神经网络分类的准确率提高约百分之二.
推荐文章
新闻标题的审美探析
新闻标题
审美
内容
意境
试论新闻标题的和谐美
新闻
标题
和谐美
新闻学
浅析英语新闻标题的汉译技巧
英语新闻标题
直译
意译
修辞
新冠肺炎疫情新闻标题的战争隐喻探析
新冠肺炎疫情
新闻标题
战争隐喻
认知基础
语用效果
成因
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于深度神经决策森林的新闻标题分类
来源期刊 云南民族大学学报(自然科学版) 学科 工学
关键词 新闻标题 特征扩展 频繁词项挖掘 卷积神经网络 决策森林分类
年,卷(期) 2020,(5) 所属期刊栏目 大数据与机器学习
研究方向 页码范围 472-479
页数 8页 分类号 TP181
字数 语种 中文
DOI 10.3969/j.issn.1672-8513.2020.05.011
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (35)
共引文献  (9)
参考文献  (11)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(2)
  • 参考文献(0)
  • 二级参考文献(2)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(3)
  • 参考文献(0)
  • 二级参考文献(3)
2015(5)
  • 参考文献(1)
  • 二级参考文献(4)
2016(9)
  • 参考文献(2)
  • 二级参考文献(7)
2017(7)
  • 参考文献(1)
  • 二级参考文献(6)
2018(7)
  • 参考文献(3)
  • 二级参考文献(4)
2019(5)
  • 参考文献(4)
  • 二级参考文献(1)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
新闻标题
特征扩展
频繁词项挖掘
卷积神经网络
决策森林分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
云南民族大学学报(自然科学版)
双月刊
1672-8513
53-1192/N
大16开
中国昆明市一二·一大街134号
1992
chi
出版文献量(篇)
2286
总下载数(次)
5
总被引数(次)
8502
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导