基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
在分析现有的藏语自动分词方法基础上,该文通过分析藏文构词规则、句法结构、词的前后词性关系、后加字(R)的添接法和格助词的用法等来重点研究了未登录词、紧缩词和交集型歧义的识别及处理方法,并提出了“重组法”,“排除—还原法”和“词性规则法”三种方法.经测试,在文学类、诗歌类、医学类和新闻类等大小为1M的藏语语料中未登录词、紧缩词和交集型歧义的识别准确率分别达到99.84%、99.95%和92.02%.
推荐文章
核心素养落地的几个关键问题
核心素养
课程标准
教学方式
考试与评价
论河北生态省建设的几个关键问题
生态省
生态环境
生态产业
生态文化
核心素养落地的几个关键问题
核心素养
课程标准
教学方式
考试与评价
对雷达组网数据融合中几个关键问题的研究
雷达组网
数据融合
空间配准
误差校正
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 藏语自动分词中的几个关键问题的研究
来源期刊 中文信息学报 学科 工学
关键词 未登录词 紧缩词 交集型歧义
年,卷(期) 2014,(4) 所属期刊栏目 少数民族语言信息处理
研究方向 页码范围 132-139
页数 8页 分类号 TP391
字数 8723字 语种 中文
DOI
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 尼玛扎西 西藏大学现代教育技术中心 38 104 7.0 9.0
2 完么扎西 青海师范大学民族师范学院 8 23 2.0 4.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (97)
参考文献  (5)
节点文献
引证文献  (11)
同被引文献  (44)
二级引证文献  (15)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(11)
  • 参考文献(1)
  • 二级参考文献(10)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(1)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(1)
  • 二级参考文献(2)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(3)
  • 引证文献(2)
  • 二级引证文献(1)
2018(4)
  • 引证文献(2)
  • 二级引证文献(2)
2019(15)
  • 引证文献(5)
  • 二级引证文献(10)
2020(2)
  • 引证文献(0)
  • 二级引证文献(2)
研究主题发展历程
节点文献
未登录词
紧缩词
交集型歧义
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导