作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
现有的医学健康问句数据大多数都是短文本,但短文本存在特征稀疏的局限性.对此,提出一种融合特征的方法,首先通过基于变换器的双向编码器表征技术(Bidirectional Encoder Representations from Transformers,BERT)字符级特征的输出取平均并与BERT句子级特征的输出进行拼接,然后使用分类器进行分类.实验结果表明,本模型可以有效地提高模型提取特征的能力,在处理Kesci公众健康问句分类数据集上F1值达到83.92%,在处理中文健康公众问句数据集时F1值达到87%.
推荐文章
基于BERT字向量和TextCNN的农业问句分类模型分析
农业问句
智能问答系统
问句分类
预训练语言模型(BERT)
文本卷积神经网络
基于改进Tri-training算法的中文问句分类
Tri-training算法
随机采样
问句分类
基于BERT-AWC的文本分类方法研究
文本分类
注意力机制
卷积神经网络
混合注意力机制
基于KNN的汉语问句分类
问句分类
语义相似度
KNN分类器
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BERT的中文健康问句分类研究
来源期刊 电视技术 学科 工学
关键词 基于变换器的双向编码器表征(BERT) 健康问句 字符级特征 句子级特征
年,卷(期) 2022,(3) 所属期刊栏目 器件与设计|PARTS & DESIGN
研究方向 页码范围 67-70
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.16280/j.videoe.2022.03.015
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
基于变换器的双向编码器表征(BERT)
健康问句
字符级特征
句子级特征
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电视技术
月刊
1002-8692
11-2123/TN
大16开
北京市朝阳区酒仙桥北路乙7号(北京743信箱杂志社)
2-354
1977
chi
出版文献量(篇)
12294
总下载数(次)
21
论文1v1指导