基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
基于实例的机器翻译(example-based machine translation,简称EBMT)使用预处理过的双语例句作为主要翻译资源,通过编辑与待翻译句子匹配的翻译实例来生成译文.在EBMT系统中,翻译实例选择及译文选择对系统性能影响较大.提出利用统计搭配模型来增强EBMT系统中翻译实例选择及译文选择的能力,提高译文质量.首先,使用单语统计词对齐从单语语料中训练统计搭配模型.然后,利用该模型从3个方面提高EBMT的性能:(1)利用统计搭配模型估计待翻译句子与翻译实例之间的匹配度,从而增强系统的翻译实例选择能力;(2)通过引入候选译文与上下文之间搭配强度的估计来提高译文选择能力;(3)使用统计搭配模型检测翻译实例中被替换词的搭配词,同时根据新的替换词及上下文对搭配词进行矫正,进一步提高EBMT系统的译文质量.为了验证所提出的方法,在基于词的EBMT系统上评价了英汉翻译的译文质量.与基线系统相比,所提出的方法使译文的BLEU得分提高了4.73~6.48个百分点.在半结构化的EBMT系统上进一步检验了基于统计搭配模型的译文选择方法,从实验结果来看,该方法使译文的BLEU得分提高了1.82个百分点.同时,人工评价结果显示,改进后的半结构化EBMT系统的译文能够表达原文的大部分信息,并且具有较高的流利度.
推荐文章
基于语义网络的英语机器翻译模型设计与改进
语义网络
机器翻译
模型设计
语义相似度
语料库
权重训练
基于现代智能识别技术的英语机器翻译模型
智能识别技术
英语翻译
机器翻译模型
结构歧义
最大熵
翻译准确度
汉语语言模型的规模对统计机器翻译系统的影响
n元语法
语言模型
基于短语的统计机器翻译系统
层次短语
基于短语相似度的统计机器翻译模型
相似度
基于短语的统计机器翻译
基于实例的机器翻译
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 利用统计搭配模型改进基于实例的机器翻译
来源期刊 软件学报 学科 工学
关键词 统计搭配模型 基于实例的机器翻译 实例选择 译文选择
年,卷(期) 2012,(6) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 1472-1485
页数 分类号 TP18
字数 11372字 语种 中文
DOI 10.3724/SP.J.1001.2012.04069
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李生 哈尔滨工业大学计算机科学与技术学院 118 3318 28.0 56.0
2 刘挺 哈尔滨工业大学计算机科学与技术学院 142 4348 34.0 63.0
3 王海峰 8 26 3.0 4.0
4 刘占一 哈尔滨工业大学计算机科学与技术学院 2 14 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (2)
共引文献  (1)
参考文献  (4)
节点文献
引证文献  (13)
同被引文献  (61)
二级引证文献  (38)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2015(3)
  • 引证文献(2)
  • 二级引证文献(1)
2016(5)
  • 引证文献(3)
  • 二级引证文献(2)
2017(5)
  • 引证文献(2)
  • 二级引证文献(3)
2018(10)
  • 引证文献(4)
  • 二级引证文献(6)
2019(17)
  • 引证文献(1)
  • 二级引证文献(16)
2020(10)
  • 引证文献(0)
  • 二级引证文献(10)
研究主题发展历程
节点文献
统计搭配模型
基于实例的机器翻译
实例选择
译文选择
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
论文1v1指导