基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
维吾尔语是典型的黏着性语言,其派生能力很强,具有丰富的形态变化,同时遵循语音和谐规律,生成过程中会出现弱化、增音、脱落等音变现象.这些特性决定了维吾尔语词法分析的难点,包括词干提取、发生音变字母的还原以及标注.将维吾尔语词的层次结构引入到词法分析研究中,提出了维吾尔语词法分析的有向图模型,该模型将维吾尔语词法分析描述为有向图结构,图中节点表示词干、词缀及其相应标注,其边表示节点之间的转移或生成概率并将此概率作为候选择优的依据.针对维吾尔语在形态变化过程中发生的音变现象,又提出基于词内字母对齐算法的自动还原模型,该模型将音变现象泛化到每个字母上的假设之下,将还原问题转变成类似于词性标注问题,再利用统计方法进行还原在对新疆多语种信息技术重点实验室手工标注的《维吾尔语百万词词法分析语料库》上进行的实验中,取得了词干提取正确率为94.7%,词干与各词缀切分并标注的F值达到92.6%的好成绩.
推荐文章
基于N元模型的维吾尔语词性标注实验研究
词性标注
N元模型
维吾尔语词性标注
现代维吾尔语词干词类标注标记集验证性研究
现代维吾尔语词干
词类标注
标记集
验证
现代维吾尔文网络媒体用词研究
现代维吾尔文
网站
词语
统计
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 维吾尔语词法分析的有向图模型
来源期刊 软件学报 学科 工学
关键词 维吾尔语 词法分析 词语切分 词性标注 有向图
年,卷(期) 2012,(12) 所属期刊栏目 模式识别与人工智能
研究方向 页码范围 3115-3129
页数 15页 分类号 TP391
字数 10406字 语种 中文
DOI 10.3724/SP.J.1001.2012.04205
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姜文斌 中国科学院计算技术研究所 17 153 8.0 12.0
5 刘群 中国科学院计算技术研究所 85 2516 22.0 49.0
6 吐尔根·依布拉音 新疆大学信息科学与工程学院 116 771 14.0 22.0
7 麦热哈巴·艾力 新疆大学信息科学与工程学院 14 87 6.0 9.0
11 王志洋 中国科学院计算技术研究所 3 54 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (39)
共引文献  (105)
参考文献  (14)
节点文献
引证文献  (37)
同被引文献  (87)
二级引证文献  (54)
1980(1)
  • 参考文献(0)
  • 二级参考文献(1)
1987(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(9)
  • 参考文献(2)
  • 二级参考文献(7)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(5)
  • 参考文献(1)
  • 二级参考文献(4)
2008(4)
  • 参考文献(2)
  • 二级参考文献(2)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(4)
  • 参考文献(0)
  • 二级参考文献(4)
2017(2)
  • 参考文献(0)
  • 二级参考文献(2)
2018(1)
  • 参考文献(0)
  • 二级参考文献(1)
2019(1)
  • 参考文献(0)
  • 二级参考文献(1)
2012(1)
  • 参考文献(0)
  • 二级参考文献(1)
  • 引证文献(0)
  • 二级引证文献(0)
2013(2)
  • 引证文献(2)
  • 二级引证文献(0)
2014(3)
  • 引证文献(3)
  • 二级引证文献(0)
2015(8)
  • 引证文献(7)
  • 二级引证文献(1)
2016(9)
  • 引证文献(6)
  • 二级引证文献(3)
2017(18)
  • 引证文献(8)
  • 二级引证文献(10)
2018(17)
  • 引证文献(5)
  • 二级引证文献(12)
2019(19)
  • 引证文献(6)
  • 二级引证文献(13)
2020(15)
  • 引证文献(0)
  • 二级引证文献(15)
研究主题发展历程
节点文献
维吾尔语
词法分析
词语切分
词性标注
有向图
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
软件学报
月刊
1000-9825
11-2560/TP
16开
北京8718信箱
82-367
1990
chi
出版文献量(篇)
5820
总下载数(次)
36
总被引数(次)
226394
相关基金
国家社会科学基金
英文译名:Philosophy and Social Science Foundation of China
官方网址:http://www.npopss-cn.gov.cn/
项目类型:重点项目
学科类型:马列·科社
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导