基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
命名实体识别(Named entity recognition,NER)是自然语言处理(Natural language processing,NLP)中重要的任务,其中人名实体是主要的识别对象之一.本文从维吾尔语黏着性特点出发,从词干、音节、字符串三个角度对维吾尔语单词进行拆分,获得更小的语言单元,并把切分的新单元作为特征加入到条件随机场(Conditional random field,CRF)中,明显缓解了数据稀疏的影响,取得了比以单词为基本单元的人名识别方法更好的性能.同时还从维吾尔语中汉族人名的特点出发,提出了基于规则的维吾尔语中汉族人名的识别方法,最终利用统计和规则相结合的方法进一步提高了识别的准确率.实验结果表明,该方法人名识别的准确率、召回率和F1值分别达到了87.47%、89.12%和88.29%.
推荐文章
统计与规则相结合的维吾尔语句子边界识别
维吾尔文
句子边界识别
规则
特征选择
最大熵
论汉族人名的维吾尔语翻译
维吾尔语
汉族人名
识别翻译
南疆维吾尔语语音识别研究与实现
维吾尔语
语音识别
动态时间规整
维吾尔语情感词汇自动识别
维吾尔语
情感词汇
特征识别
条件随机场
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 统计与规则相结合的维吾尔语人名识别方法
来源期刊 自动化学报 学科
关键词 维吾尔语 人名识别 条件随机场 音节库
年,卷(期) 2017,(4) 所属期刊栏目 论文与报告
研究方向 页码范围 653-664
页数 12页 分类号
字数 13124字 语种 中文
DOI 10.16383/j.aas.2017.c150769
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 艾斯卡尔·艾木都拉 新疆大学信息科学与工程学院 170 561 11.0 15.0
2 汪昆 中国科学院自动化研究所模式识别国家重点实验室 3 36 3.0 3.0
3 塔什甫拉提·尼扎木丁 新疆大学信息科学与工程学院 2 12 1.0 2.0
4 帕力旦·吐尔逊 新疆大学软件学院 12 89 6.0 9.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (40)
共引文献  (64)
参考文献  (8)
节点文献
引证文献  (11)
同被引文献  (48)
二级引证文献  (15)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(3)
  • 参考文献(0)
  • 二级参考文献(3)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(7)
  • 参考文献(1)
  • 二级参考文献(6)
2005(2)
  • 参考文献(1)
  • 二级参考文献(1)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(4)
  • 参考文献(2)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(8)
  • 参考文献(1)
  • 二级参考文献(7)
2013(3)
  • 参考文献(2)
  • 二级参考文献(1)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(13)
  • 引证文献(7)
  • 二级引证文献(6)
2020(10)
  • 引证文献(1)
  • 二级引证文献(9)
研究主题发展历程
节点文献
维吾尔语
人名识别
条件随机场
音节库
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
自动化学报
月刊
0254-4156
11-2109/TP
大16开
北京市海淀区中关村东路95号(北京2728信箱)
2-180
1963
chi
出版文献量(篇)
4124
总下载数(次)
26
总被引数(次)
120705
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导