基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
维吾尔语中,词的复杂形态是导致数据稀疏问题的主要原因,为降低数据稀疏对词对齐和机器翻译的不良影响,尽可能挖掘词尾携带的语义信息,提出对词尾采取“分离-丢弃”方案。根据统计分析,对维吾尔语词进行词干、词尾分离后,对其语义信息被明文翻译概率高的词尾采取“分离”方案,概率低的词尾采取“丢弃”方案。将该方案应用到维吾尔语名词和动词上,分等级构造9种模板进行实验,实验结果表明,该方案抑制了词干、词尾分离带来的句子长度过长问题,增加了维汉词对的数量,提高了维汉机器翻译质量,验证了该方案的有效性。
推荐文章
维吾尔语词尾对汉维统计机器翻译影响的研究
黏着语
词尾
统计机器翻译
层次短语翻译模型
语言模型
维吾尔语复杂形态对汉维机器翻译的影响研究
维吾尔语形态
构形词缀
词缀粒度
统计机器翻译
翻译质量
维吾尔语双音节词元音格局研究
维吾尔语
共振峰
双音节词
元音格局
共振峰模式
采用相关反馈和文档相似度的维吾尔语检索词加权方法
维吾尔语
文档检索
检索词加权
相关反馈
文档相似度
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 维吾尔语不同词尾粒度对维汉词对齐的影响
来源期刊 计算机工程与设计 学科 工学
关键词 词对齐 维汉机器翻译 维汉词对齐 词尾粒度 形态分析
年,卷(期) 2015,(8) 所属期刊栏目 开发与应用
研究方向 页码范围 2297-2302
页数 6页 分类号 TP391
字数 5204字 语种 中文
DOI 10.16208/j.issn1000-7024.2015.08.056
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 麦热哈巴·艾力 新疆大学信息科学与工程学院 14 87 6.0 9.0
2 麦合甫热提 新疆大学教务处 10 16 2.0 3.0
3 米莉万·雪合来提 新疆大学信息科学与工程学院 2 20 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (22)
共引文献  (17)
参考文献  (4)
节点文献
引证文献  (2)
同被引文献  (4)
二级引证文献  (0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(4)
  • 参考文献(1)
  • 二级参考文献(3)
2011(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(3)
  • 参考文献(3)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
词对齐
维汉机器翻译
维汉词对齐
词尾粒度
形态分析
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与设计
月刊
1000-7024
11-1775/TP
大16开
北京142信箱37分箱
82-425
1980
chi
出版文献量(篇)
18818
总下载数(次)
45
总被引数(次)
161677
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导