基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
该文提出一种层次短语模型过滤和优化方法.该方法在采用传统方法训练得到层次短语规则的基础上,通过强制对齐同时构建源语言和目标语言的解析树,从中过滤并抽取对齐的层次短语规则,最后利用这些规则重新估计翻译模型的翻译概率.该方法不需要引入任何语言学知识,适合大规模语料训练模型.在大规模中英翻译评测任务中,采用该方法训练的模型与传统层次短语模型相比,不仅能够过滤50%左右规则,同时获得0.8~1.2BLEU值的提高.
推荐文章
融入双语最大名词短语的机器翻译模型
统计机器翻译
短语翻译模型
最大名词短语
双语最大名词短语
基于混合优化和合作接收策略的干扰对齐算法
干扰对齐
合作接收
泄漏干扰
协方差矩阵
基于角色的强制访问控制模型
信息安全
访问控制
角色
约束
基于任务的强制访问控制模型
任务
访问控制
模型
授权
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于强制对齐的层次短语模型过滤和优化
来源期刊 中文信息学报 学科 工学
关键词 统计机器翻译 层次短语 强制对齐 模型训练
年,卷(期) 2013,(6) 所属期刊栏目
研究方向 页码范围 134-138,150
页数 6页 分类号 TP391
字数 5312字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐波 中国科学院自动化研究所数字内容技术与服务中心 92 929 15.0 27.0
2 魏玮 中国科学院自动化研究所数字内容技术与服务中心 4 16 2.0 4.0
3 付晓寅 中国科学院自动化研究所数字内容技术与服务中心 1 1 1.0 1.0
4 卢世祥 中国科学院自动化研究所数字内容技术与服务中心 2 26 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (1)
同被引文献  (3)
二级引证文献  (1)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
统计机器翻译
层次短语
强制对齐
模型训练
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导