原文服务方: 计算机应用研究       
摘要:
濒危语言典藏以抢救和长久保存濒危语言口语中所包含的声学、语言学以及文学、历史、传统文化等内涵的全部信息为目的,吕苏语作为一种无文字文献记录的濒危语言,对其口语语料典藏意义重大.吕苏语口语的汉语标注语料自动分词是后续建立高质量的吕苏语口语语料库和吕苏语典藏系统的基础性工作.目前对于吕苏语标注语料分词的研究几乎为零,对吕苏语特点进行了分析,同时将中文自动分词结巴方法应用到吕苏语汉语标注语料中;并针对结巴分词算法对吕苏语标注语料分词存在的误分词问题,提出了改进结巴算法.经过实验对比,改进结巴的分词方法准确率更高,提高了吕苏语汉语标注语料的分词效果.
推荐文章
基于音节标注的藏文自动分词研究
藏文
分词
序列标注
最大熵
条件随机场
最大间隔Markov网络模型
基于LSTM网络的序列标注中文分词法
中文分词
LSTM
字嵌入
自然语言处理
基于助词用法的汉语词性、分词错误自动发现
助词知识库
用法
规则
自动标注
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 吕苏语口语标注语料的自动分词方法研究
来源期刊 计算机应用研究 学科
关键词 吕苏语 汉语标注语料 自动分词 改进结巴算法
年,卷(期) 2017,(5) 所属期刊栏目 算法研究探讨
研究方向 页码范围 1325-1328
页数 4页 分类号 TP391.1
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.05.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 于重重 北京工商大学计算机与信息工程学院 99 762 14.0 23.0
2 操镭 北京工商大学计算机与信息工程学院 2 29 2.0 2.0
3 尹蔚彬 中国社会科学院民族学与人类学研究所 17 43 3.0 6.0
4 郑雅 北京工商大学计算机与信息工程学院 4 41 3.0 4.0
5 张泽宇 北京工商大学计算机与信息工程学院 3 43 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (66)
共引文献  (101)
参考文献  (12)
节点文献
引证文献  (26)
同被引文献  (120)
二级引证文献  (31)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1988(2)
  • 参考文献(0)
  • 二级参考文献(2)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(4)
  • 参考文献(0)
  • 二级参考文献(4)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(5)
  • 参考文献(0)
  • 二级参考文献(5)
2004(7)
  • 参考文献(1)
  • 二级参考文献(6)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(8)
  • 参考文献(0)
  • 二级参考文献(8)
2007(11)
  • 参考文献(1)
  • 二级参考文献(10)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(2)
  • 参考文献(1)
  • 二级参考文献(1)
2010(4)
  • 参考文献(0)
  • 二级参考文献(4)
2011(6)
  • 参考文献(1)
  • 二级参考文献(5)
2013(5)
  • 参考文献(0)
  • 二级参考文献(5)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(4)
  • 参考文献(4)
  • 二级参考文献(0)
2017(2)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(2)
  • 二级引证文献(0)
2017(2)
  • 引证文献(2)
  • 二级引证文献(0)
2018(9)
  • 引证文献(6)
  • 二级引证文献(3)
2019(25)
  • 引证文献(13)
  • 二级引证文献(12)
2020(21)
  • 引证文献(5)
  • 二级引证文献(16)
研究主题发展历程
节点文献
吕苏语
汉语标注语料
自动分词
改进结巴算法
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导