基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
藏语的"音节"在词汇语法研究和文本信息处理研究中都十分重要,尤其在解决未登录词切分问题和标注中能够发挥积极的作用.然而在现有的研究中,对音节的重视还不够.该文提出在文本标注时,可以先进行音节的性质标注,然后通过音节构词的规律预测复合词的词性,尤其是未登录词的词性.该文作者对藏语音节的定义进行了界定,提出音节的性质分类及标注原则,利用统计模型,在约24万音节的中小学语文教材语料库上进行实验,音节性质标注的正确率为93.5208%.在此基础上,把音节性质标注信息用到词性标注中.实验结果表明:即使在音节性质标注存在一定错误的情况下,词性标注的正确率也提高到94.1967%;如果在保证音节性质标注完全正确的情况下,词性标注的正确率可以提高到97.7754%,这说明音节性质标注信息对词性标注有帮助.
推荐文章
基于音节标注的藏文自动分词研究
藏文
分词
序列标注
最大熵
条件随机场
最大间隔Markov网络模型
藏语拉萨语LPC语音参数提取研究
藏语语音
LPC
参数提取
语音信号
基于Matlab的藏语语音基音检测算法研究
基音检测
藏语语音
自相关算法
Matlab
基于优化Apriori算法的藏语音韵律规则研究
语音合成
韵律参数
关联规则
Apriori算法
Java实现
敏捷设计原则
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 藏语音节标注研究
来源期刊 中文信息学报 学科
关键词 藏语 藏语音节 音节性质标注 音节性质分类
年,卷(期) 2017,(4) 所属期刊栏目 少数民族语言处理
研究方向 页码范围 89-93,99
页数 6页 分类号
字数 5316字 语种 中文
DOI 10.3969/j.issn.1003-0077.2017.04.013
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 刘汇丹 中国科学院软件研究所 17 85 5.0 8.0
2 吴健 中国科学院软件研究所 60 513 11.0 20.0
3 龙从军 中国社会科学院民族学与人类学研究所 9 36 3.0 5.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (41)
共引文献  (234)
参考文献  (8)
节点文献
引证文献  (2)
同被引文献  (22)
二级引证文献  (0)
1985(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(3)
  • 参考文献(0)
  • 二级参考文献(3)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(3)
  • 参考文献(1)
  • 二级参考文献(2)
2009(7)
  • 参考文献(1)
  • 二级参考文献(6)
2010(6)
  • 参考文献(0)
  • 二级参考文献(6)
2011(3)
  • 参考文献(1)
  • 二级参考文献(2)
2012(4)
  • 参考文献(1)
  • 二级参考文献(3)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(2)
  • 二级引证文献(0)
研究主题发展历程
节点文献
藏语
藏语音节
音节性质标注
音节性质分类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中文信息学报
月刊
1003-0077
11-2325/N
16开
北京海淀区中关村南四街4号
1986
chi
出版文献量(篇)
2723
总下载数(次)
5
总被引数(次)
45413
论文1v1指导