基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
司法文书短文本的语义多样性和特征稀疏性等特点,对短文本多标签分类精度提出了很大的挑战,传统单一模型的分类算法已无法满足业务需求.为此,提出一种融合深度学习与堆叠模型的多标签分类方法.该方法将分类器划分成两个层次,第一层使用BERT、卷积神经网络、门限循环单元等深度学习方法作为基础分类器,每个基础分类器模型通过K折交叉验证得到所有数据的多标签分类概率值,将此概率值数据进行融合形成元数据;第二层使用自定义的深度神经网络作为混合器,以第一层的元数据为输入,通过训练多标签概率矩阵获取模型参数.该方法将强分类器关联在一起,获得比单个分类器更加强大的性能.实验结果表明,深度学习堆叠模型实现了87%左右的短文本分类F1分数,优于BERT、卷积神经网络、循环神经网络及其他单个模型的性能.
推荐文章
CNN-ELM混合短文本分类模型
文本分类
卷积神经网络
极速学习机
基于支持向量机的中文极短文本分类模型
支持向量机
jieba分词
极短文本分类
TF-IDF
基于ConvLSTM模型的短文本情感分类研究
短文本
情感分类
CNN
LSTM
ConvLSTM模型
深度学习模型
基于双视角投影空间表示的文本多标签标注方法
投影空间
文本标注
多标签
双视角
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于堆叠模型的司法短文本多标签分类
来源期刊 计算机技术与发展 学科
关键词 堆叠模型 BERT 卷积神经网络 门限循环单元 多标签分类
年,卷(期) 2021,(3) 所属期刊栏目 大数据分析与挖掘
研究方向 页码范围 27-32
页数 6页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1673-629X.2021.03.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (4)
共引文献  (28)
参考文献  (2)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(1)
  • 参考文献(1)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
堆叠模型
BERT
卷积神经网络
门限循环单元
多标签分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机技术与发展
月刊
1673-629X
61-1450/TP
大16开
西安市雁塔路南段99号
52-127
1991
chi
出版文献量(篇)
12927
总下载数(次)
40
总被引数(次)
111596
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导