原文服务方: 南方农业学报       
摘要:
【目的】研究不同词向量和深度学习模型组合对农业问句分类结果的影响,为构建农业智能问答系统提供技术支撑。【方法】通过爬虫获取农业种植网等网站的问答数据,选择20000条问句进行人工标注,构建农业问句分类语料库。采用BERT对农业问句进行字符编码,利用文本卷积神经网络(TextCNN)提取问句高维度特征对农业问句进行分类。【结果】在词向量对比实验中,BERT字向量与TextCNN结合时农业问句分类F1值达93.32%,相比Word2vec字向量提高2.1%。在深度学习模型的分类精度对比方面,TextCNN与Word2vec和BERT字向量结合的F1值分别达91.22%和93.32%,均优于其他模型。在农业问句的细分试验中,BERT-TextCNN在栽培技术、田间管理、土肥水管理和其他4个类别中分类F1值分别为86.06%、90.56%、95.04%和85.55%,均优于其他深度学习模型。超参数设置方面,BERT-TextCNN农业问句分类模型卷积核大小设为[3,4,5]、学习率设为5e-5、迭代次数设为5时效果最优,该模型在数据样本不均衡的情况下,对于农业问句的平均分类准确率依然能达93.00%以上,可满足农业智能问答系统的问句分类需求。【建议】通过阿里NLP等开源平台提升数据标注质量;在分类过程中补充词频和文档特征,提高模型分类精度;农业相关政府职能部门加强合作,积极探索农业技术数字化推广和服务新模式。
推荐文章
基于BERT-AWC的文本分类方法研究
文本分类
注意力机制
卷积神经网络
混合注意力机制
基于KNN的汉语问句分类
问句分类
语义相似度
KNN分类器
融合TextCNN与TextRNN模型的谣言识别方法
社交网络
谣言识别
BERT模型
文本卷积神经网络
文本循环神经网络
基于支持向量机的问句分析
概念层次网络理论
问句分类
支持向量机
中文信息处理
问答系统
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BERT字向量和TextCNN的农业问句分类模型分析
来源期刊 南方农业学报 学科
关键词 农业问句 智能问答系统 问句分类 预训练语言模型(BERT) 文本卷积神经网络
年,卷(期) 2023,(7) 所属期刊栏目 农业信息技术·农业经济
研究方向 页码范围 2068-2076
页数 8页 分类号 S126,TP391.1
字数 语种 中文
DOI 10.3969/j.issn.2095-1191.2022.07.031
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2023(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
农业问句
智能问答系统
问句分类
预训练语言模型(BERT)
文本卷积神经网络
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
南方农业学报
月刊
2095-1191
45-1381/S
大16开
1964-01-01
chi
出版文献量(篇)
7029
总下载数(次)
0
总被引数(次)
43586
论文1v1指导