基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
由于船舶工业领域中的新闻内容篇幅较长且专业性较强,同时包含大量船舶领域专业词汇,目前针对该领域新闻文本分类的研究较少且缺少相应的船舶工业新闻语料.构建了一个船舶工业新闻语料库,并提出了一种新的面向船舶工业新闻的文本分类算法,首先基于文档频率、卡方统计量及主题模型LSA进行特征选择和特征降维,将文档-词矩阵映射成文档-主题矩阵后,最终对处理后的特征采用支持向量机进行文本分类.通过新闻文本分类的实验表明,所提出的算法能够有效解决文本向量的高维度、高稀疏性问题,在小样本集和类别有限的前提下相比传统方法具有较好的分类效果.
推荐文章
基于事件卷积特征的新闻文本分类
文本分类
事件
卷积神经网络
自然语言处理
基于深度神经网络的中文新闻文本分类方法
深度神经网络
文本分类
中文新闻
自然语言处理
面向审计领域的短文本分类技术研究
审计问题分类
审计领域
信息增益
SVM决策树
短文本分类
审计报告
基于"中文新闻信息分类与代码"文本分类
文本分类
中文新闻信息分类与代码
新闻文本
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向船舶工业新闻的文本分类
来源期刊 电子测量与仪器学报 学科 工学
关键词 文本分类 主题模型 特征选择 支持向量机(SVM)
年,卷(期) 2020,(1) 所属期刊栏目 学术论文
研究方向 页码范围 149-155
页数 7页 分类号 TP391
字数 语种 中文
DOI 10.13382/j.jemi.B1902323
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王晓峰 71 454 12.0 17.0
2 朱芳鹏 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (79)
共引文献  (105)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1953(1)
  • 参考文献(0)
  • 二级参考文献(1)
1960(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(10)
  • 参考文献(0)
  • 二级参考文献(10)
2010(5)
  • 参考文献(0)
  • 二级参考文献(5)
2011(8)
  • 参考文献(0)
  • 二级参考文献(8)
2012(9)
  • 参考文献(2)
  • 二级参考文献(7)
2013(3)
  • 参考文献(0)
  • 二级参考文献(3)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(6)
  • 参考文献(1)
  • 二级参考文献(5)
2016(9)
  • 参考文献(2)
  • 二级参考文献(7)
2017(6)
  • 参考文献(3)
  • 二级参考文献(3)
2018(8)
  • 参考文献(8)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
文本分类
主题模型
特征选择
支持向量机(SVM)
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子测量与仪器学报
月刊
1000-7105
11-2488/TN
大16开
北京市东城区北河沿大街79号
80-403
1987
chi
出版文献量(篇)
4663
总下载数(次)
23
总被引数(次)
44770
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导