基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
问题生成的核心任务是"在给定上下文语境的前提下,对目标答案自动生成相应的疑问句".问题生成是自然语言处理领域中富有挑战性的任务之一,其对可靠的语义编码和解码技术有着极高的要求.目前,预训练语言模型已在不同自然语言处理任务中得到广泛应用,并取得了较好的应用效果.该文继承这一趋势,尝试将预训练语言模型UNILM应用于现有"基于编码和解码架构"的问题生成系统中,并集中在其适应性问题上开展研究.该文针对预训练模型在解码阶段频繁出现的"暴露偏差"和"掩码异构"问题,分别研究了基于随机抗噪和迁移学习的训练方法,借以提升UNILM在问题生成过程中的适应能力.同时,该文在SQuAD数据集上开展问题生成实验,实验结果证明,随机抗噪和迁移学习都能优化UNILM的解码性能,使之在答案可知场景的数据划分split1和split2上,分别将BLEU4指标提升到20.31%和21.95%;并在答案不可知场景的split1数据集上将BLEU4指标提升到17.90%.
推荐文章
面向方面软件体系结构适应性度量方法
适应性
度量
软件体系结构
面向方面软件体系结构
功能点
面向对象的复杂电磁环境适应性评估方法
复杂环境
电磁环境
适应性
面向对象
软件适应性度量方法研究
软件适应性
度量指标
度量模型
版本演化
一种BP逆模型离线训练自适应预失真方法
BP逆模型
预失真
功率放大器
最小均方算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向问题生成的预训练模型适应性优化方法研究
来源期刊 中文信息学报 学科 工学
关键词 问题生成 暴露偏差 问答数据集 迁移学习
年,卷(期) 2022,(3) 所属期刊栏目 问答与对话|Question Answering and Dialogue System
研究方向 页码范围 91-100
页数 10页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1003-0077.2022.03.011
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
问题生成
暴露偏差
问答数据集
迁移学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导