基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
对话是自然语言处理的一个重要研究领域,其成果已经得到广泛的应用.然而中文对话模型训练时由于字词数量庞大,必然会面临模型复杂度过高的问题.为解决此问题,该文首先将对话模型的汉字输入转化为拼音输入并将拼音分为声母、韵母和声调三个部分,以此减小输入的字词数量.然后以嵌入编码的方法将拼音信息组合为图像形式,再通过全卷积神经网络(FCN)和双向Long Short Term Memory(LSTM)网络提取拼音特征.最后采用4层的Gated Recurrent Units(GRU)网络对拼音特征进行解码以解决长时记忆问题,得到对话模型的输出.在此基础上,模型在解码阶段加入了注意力机制,使模型的输出可以更好地与输入进行对应.为对提出的中文对话模型进行评价,该文建立了应用于医疗领域的中文对话数据库,并以BLEU和ROUGE_L为评价指标在该数据库上对模型进行了测试.
推荐文章
基于HSI彩色模型的图像降维技术
HSI颜色模型
本征维数
图像降维
RGB
基于Linux下Qt/E的中文拼音输入法设计
Linux
Qt/E
图形用户界面
中文拼音输入法
采用非线性Galerkin方法的柔性梁模型降阶研究
柔性梁
模型降阶
非线性Galerkin方法
非线性动力学行为
分岔
采用遗传算法实现时域模型降阶
模型降阶
遗传算法
二阶系统模型
时间响应匹配
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 采用拼音降维的中文对话模型
来源期刊 中文信息学报 学科 工学
关键词 对话模型 拼音特征 注意力机制
年,卷(期) 2019,(5) 所属期刊栏目 问答、对话、阅读理解
研究方向 页码范围 113-121
页数 9页 分类号 TP391
字数 5939字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周越 上海交通大学自动化系系统控制与信息处理教育部重点实验室 60 976 18.0 30.0
2 赵群飞 上海交通大学自动化系系统控制与信息处理教育部重点实验室 58 494 12.0 17.0
3 张朋柱 上海交通大学安泰经济与管理学院管理信息系统系 152 1491 20.0 30.0
4 吴邦誉 上海交通大学自动化系系统控制与信息处理教育部重点实验室 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (15)
共引文献  (9)
参考文献  (5)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1975(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(3)
  • 参考文献(1)
  • 二级参考文献(2)
2016(2)
  • 参考文献(0)
  • 二级参考文献(2)
2017(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
对话模型
拼音特征
注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导