基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
自然语言生成是目前非常重要且具有挑战性的一类人工智能任务.长短时记忆(Long Short-Term Memory,LSTM)语言模型是目前最为主流的自然语言生成模型.但是,LSTM语言模型的训练准则是词语级别的交叉熵,这会导致暴露偏差问题.此外,一般自然语言生成任务的评测指标是序列级别的BLEU分数或者词错误率,这与训练使用的交叉熵准则也不匹配.在本文中,我们使用马尔可夫决策过程重定义了自然语言生成问题,并通过从训练数据中提取的先验控制向量来指导生成过程.先验控制向量可以视作是对序列空间的一种先验划分的抽象,通过在自然语言生成中引入先验控制向量,我们可以更好的约束自然语言生成的空间.再通过马尔可夫决策过程的定义,我们可以使用策略梯度算法来直接使用测试使用的BLEU分数来代替交叉熵训练LSTM网络.在多个数据集上的实验显示本文提出的方法相比于普通使用LSTM语言模型的基线系统在BLEU分数上有大约绝对2%~3%的提升.
推荐文章
基于约束马尔可夫决策过程的网络生存性研究
生存性定义
生存性框架
一致性原则
生存性设计
基于马尔可夫决策过程的接纳控制模型研究
异构网络
呼叫接纳控制
马尔可夫决策过程
QoS约束
系统收益
基于马尔可夫决策过程的维修决策模型研究
失效率
基于条件维修
马尔可夫决策过程
自然语言生成综述
自然语言生成
内容规划
微观规划
表层生成
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 马尔可夫决策过程和先验控制向量在弱约束自然语言生成中的应用
来源期刊 计算机学报 学科 工学
关键词 自然语言生成 马尔可夫决策过程 先验控制向量 策略梯度算法 深度强化学习
年,卷(期) 2022,(2) 所属期刊栏目
研究方向 页码范围 289-301
页数 13页 分类号 TP18
字数 语种 中文
DOI 10.11897/SP.J.1016.2022.00289
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自然语言生成
马尔可夫决策过程
先验控制向量
策略梯度算法
深度强化学习
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
论文1v1指导