基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
词对齐是统计机器翻译系统的重要一环,但词对齐的获得往往基于序列模型的计算,而没有考虑语言的结构化信息及语言特征,从而造成词对齐中出现一些不符合语言特征的结果.文中提出一种词对齐的自纠正机制,以纠正词对齐中的错误部分.该机制使用一些语言学上的先验知识,对词对齐结果进行由粗颗粒度到细颗粒度的纠正.首先采用基于标点的方法对句对进行粗粒度化纠正,然后采用基于统计特征的方法对子句对进行细粒度化纠正.该自纠正过程不需要借助任何其他词对齐工具和新语料.实验结果显示,自纠正词对齐显著提高了词对齐的准确率,并提高了机器翻译的质量,其中粗粒度的纠正方法对翻译质量的提高最为显著,细粒度的纠正方法也提升了翻译质量,最终通过结合粗颗粒度和细颗粒度的纠正方法,使翻译结果相对基准系统取得了显著的提高.
推荐文章
一种新的自纠错句对齐算法的研究与实现
句子对齐
词性判别函数
双语语料
基于航向自纠正方法的行人导航算法研究
行人导航
足绑式惯性导航系统
航向自纠正
卡尔曼滤波
移动通信中变速率自纠错解码器设计
移动通信
语音解码
滤波器
变速率
基于词对建模的句子对齐研究
句子对齐
词对
双向循环神经网络
门关联网络
语义关系
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 自纠正词对齐
来源期刊 计算机科学 学科 工学
关键词 自纠正 词对齐 粗颗粒度到细颗粒度
年,卷(期) 2017,(12) 所属期刊栏目 人工智能
研究方向 页码范围 216-220,238
页数 6页 分类号 TP391
字数 6154字 语种 中文
DOI 10.11896/j.issn.1002-137X.2017.12.039
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张民 苏州大学计算机科学与技术学院 27 94 5.0 9.0
2 段湘煜 苏州大学计算机科学与技术学院 11 10 2.0 2.0
3 龚慧敏 苏州大学计算机科学与技术学院 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (2)
节点文献
引证文献  (2)
同被引文献  (0)
二级引证文献  (0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
自纠正
词对齐
粗颗粒度到细颗粒度
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导