原文服务方: 计算机应用研究       
摘要:
标题分类是对一个标题性语句进行分类,通常这个标题是不超过20个字的短文本,内容精炼且概括性强.针对标题文本的特征稀疏性和含义不确定性,提出了一种融合随机森林与贝叶斯多项式的标题分类算法.该算法将贝叶斯多项式模型引入到随机森林底层分类器构建过程中,同时利用随机森林附带的OOB数据提出了一种基于二维权重分布的投票机制.最后在图书馆真实书目数据上进行实验,针对分类性能与当前基于LDA主题扩展的SVM算法进行对比,实验结果表明在一定条件下,该方法性能稳定、表现较佳.
推荐文章
集成学习算法在不平衡分类中的应用研究
机器学习
类不平衡
集成学习
评测标准
基于分类问题的选择性集成学习研究
分类回归树
自助法
选择性集成
基于层级类别信息的标题自动分类研究
标题分类
特征选择
层级结构分类体系
同现分析
向量空间
基于FCBF特征选择和集成优化学习的基因表达数据分类算法
特征选择
集成学习
微阵列基因表达数据
乌鸦搜索算法
核极限学习机
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于集成学习的标题分类算法研究
来源期刊 计算机应用研究 学科
关键词 自然语言处理 标题分类 集成学习 改进随机森林 OOB二维权重分布
年,卷(期) 2017,(4) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1004-1007
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.04.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘柏嵩 宁波大学信息科学与工程学院 48 518 13.0 21.0
2 高元 宁波大学信息科学与工程学院 1 24 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (37)
共引文献  (90)
参考文献  (8)
节点文献
引证文献  (24)
同被引文献  (62)
二级引证文献  (32)
1973(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(3)
  • 参考文献(0)
  • 二级参考文献(3)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(1)
  • 二级参考文献(1)
2003(2)
  • 参考文献(1)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(0)
  • 二级参考文献(4)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(5)
  • 参考文献(1)
  • 二级参考文献(4)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(3)
  • 二级引证文献(1)
2017(4)
  • 引证文献(3)
  • 二级引证文献(1)
2018(16)
  • 引证文献(12)
  • 二级引证文献(4)
2019(21)
  • 引证文献(8)
  • 二级引证文献(13)
2020(15)
  • 引证文献(1)
  • 二级引证文献(14)
研究主题发展历程
节点文献
自然语言处理
标题分类
集成学习
改进随机森林
OOB二维权重分布
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导