基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对现有维吾尔语形态分析研究中存在的数据稀疏、模型构建复杂等问题,提出一种基于机器翻译的维吾尔语形态分析模型,即将维吾尔语词干提取(词性标注)任务中词干提取前(词性标注前)的句子看作是机器翻译模型训练过程中的源语言端,词干提取后(词性标注后)的句子看作是目标语言端;为了达到最佳的效果,加入了外部信息模块和联合校验模块以优化模型.实验结果表明,基于机器翻译框架的维吾尔语形态分析模型在词干提取、词性标注两个任务上优于其他模型.对比英语(词干提取、词性标注)、汉语(分词、词性标注)实验结果,提出的方法更适合维吾尔语形态分析.
推荐文章
维吾尔语复杂形态对汉维机器翻译的影响研究
维吾尔语形态
构形词缀
词缀粒度
统计机器翻译
翻译质量
维汉机器翻译未登录词识别研究
维汉机器翻译
短语表
字符串相似度算法
未登录词
词切分
编辑距离
维吾尔语词尾对汉维统计机器翻译影响的研究
黏着语
词尾
统计机器翻译
层次短语翻译模型
语言模型
基于粘着性模糊规则的维汉机器翻译最大熵调序研究
维汉机器翻译
形态学
粘着性
模糊规则
最大熵
调序模型
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器翻译的维吾尔语形态分析研究
来源期刊 计算机工程与应用 学科 工学
关键词 维吾尔语形态分析 基于机器翻译 词干提取 词性标注 模型优化
年,卷(期) 2017,(14) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 138-142,154
页数 6页 分类号 TP391.2
字数 5307字 语种 中文
DOI 10.3778/j.issn.1002-8331.1604-0119
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐春 中国科学院新疆理化技术研究所 26 103 5.0 9.0
4 蒋同海 中国科学院新疆理化技术研究所 26 236 10.0 14.0
5 杨勇 新疆师范大学计算机科学技术学院 35 106 5.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (17)
共引文献  (137)
参考文献  (9)
节点文献
引证文献  (5)
同被引文献  (9)
二级引证文献  (1)
1956(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(0)
  • 二级参考文献(3)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(1)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(3)
  • 参考文献(1)
  • 二级参考文献(2)
2006(4)
  • 参考文献(3)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(5)
  • 引证文献(4)
  • 二级引证文献(1)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
维吾尔语形态分析
基于机器翻译
词干提取
词性标注
模型优化
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导