基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
医疗机器翻译对于跨境医疗、医疗文献翻译等应用具有重要价值.汉英神经机器翻译依靠深度学习强大的建模能力和大规模双语平行数据取得了长足的进步.神经机器翻译通常依赖于大规模的平行句对训练翻译模型.目前,汉英翻译数据主要以新闻、政策等领域数据为主,缺少医疗领域的数据,导致医疗领域的汉英机器翻译效果不佳.针对医疗垂直领域机器翻译训练数据不足的问题,该文提出利用复述生成技术对汉英医疗机器翻译数据进行增广,扩大汉英机器翻译的规模.通过多种主流的神经机器翻译模型的实验结果表明,通过复述生成对数据进行增广可以有效地提升机器翻译的性能,在RNNSearch,Transformer等多个主流模型上均取得了6个点以上的BLEU值提升,验证了复述增广方法对领域机器翻译的有效性.同时,基于MT5等大规模预训练语言模型可以进一步地提升机器翻译的性能.
推荐文章
浅析机器翻译
机器翻译
数据库
优势
准确度
基于模板的汉英专利机器翻译研究
模板
专利文献
机器翻译
正则文法
基于语义网技术的网络机器翻译研究
网络机器翻译
语义网
信息处理
智能代理
机器翻译测评的实践与分析
句子长度
错误类型
自动测评
分级
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于复述增广的医疗领域机器翻译
来源期刊 电子与信息学报 学科 工学
关键词 神经机器翻译 汉英翻译 复述生成 数据增广 大规模预训练语言模型
年,卷(期) 2022,(1) 所属期刊栏目 深度学习与智慧医疗专题|Special Topic on Deep Learning and Smart Mdicine
研究方向 页码范围 118-126
页数 9页 分类号 TN912.3|TP393
字数 语种 中文
DOI 10.11999/JEIT210926
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2022(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
神经机器翻译
汉英翻译
复述生成
数据增广
大规模预训练语言模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
电子与信息学报
月刊
1009-5896
11-4494/TN
大16开
北京市北四环西路19号
2-179
1979
chi
出版文献量(篇)
9870
总下载数(次)
11
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导