基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
近几年来,基于短语的统计翻译模型在机器翻译研究中受到普遍关注,并取得了较好的翻译性能.但是,由于目前基于短语的翻译系统在解码时采用精确匹配的策略,常常导致数据稀疏,一方面,有些短语在训练获得的短语表中找不到精确的匹配,使其成为未知短语;另一方面,短语表中大量的短语无法得到充分的利用.为此,我们提出了基于短语模糊匹配和句子扩展的翻译方法.对于不存在于短语表中的短语,通过模糊匹配的办法,寻找与其相似的短语,然后将所有相似短语用于替换原短语,从而生成扩展句子,在此基础上时所有扩展的句子进行翻译.由于并不是所有扩展后的句子都能提高原始句子的翻译效果,因此,我们在句子翻译完成后设置了组合分类器用于选择最优翻译结果.实验证明,这种方法可以有效地提高翻译系统的译文质量.
推荐文章
基于短语相似度的统计机器翻译模型
相似度
基于短语的统计机器翻译
基于实例的机器翻译
基于短语和句法的统计机器翻译
机器翻译
统计机器翻译
噪声信道模型
理性主义方法
经验主义方法
基于短语的统计机器翻译方法
统计机器翻译
短语
语言模型
翻译模型
融入双语最大名词短语的机器翻译模型
统计机器翻译
短语翻译模型
最大名词短语
双语最大名词短语
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于短语模糊匹配和句子扩展的统计翻译方法
来源期刊 中文信息学报 学科 工学
关键词 人工智能 机器翻译 基于短语的统计机器翻译 模糊匹配 组合分类器
年,卷(期) 2009,(5) 所属期刊栏目
研究方向 页码范围 40-46
页数 7页 分类号 TP391
字数 6926字 语种 中文
DOI 10.3969/j.issn.1003-0077.2009.05.006
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 宗成庆 12 205 9.0 12.0
2 刘鹏 2 10 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (5)
同被引文献  (33)
二级引证文献  (0)
1964(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2011(1)
  • 引证文献(1)
  • 二级引证文献(0)
2012(1)
  • 引证文献(1)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
人工智能
机器翻译
基于短语的统计机器翻译
模糊匹配
组合分类器
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
论文1v1指导