基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对汉语人名识别的难点,基于最大熵算法提出了结合多知识、多模型的识别方法,充分考虑了人名的内部特征(小颗粒特征)和人名的语境信息.论文的主要贡献是:将概率信息赋予最大熵模型,极大提高人名的准确率和召回率;细化了分类模型,将人名识别分成中国人名识别、外国译名识别和单字人名识别;提出动态优先级方法来防止一个外国译名被部分识别为一个或几个中国人名.实验测试数据为1998年1月的人民日报和Sighan(2006)命名实体测试语料.测试结果表明,人民日报(1998-01)的召回率为90.06%,准确率为89.27%;Sighan(MSRA)语料的召回率为95.39%,准确率为96.71%;Sighan(LDC)语料的召回率为87.56%,准确率为91.04%.实验结果证明,提出的人名识别方法是非常有效的.
推荐文章
一种基于本体论和规则匹配的中文人名识别方法
中文人名识别
命名实体识别
中文分词
本体
一种新型指针仪表识别方法研究
指针式仪表
最大灰度相减
Hough变换
边缘提取
一种基于在线学习的弹道识别方法
弹道识别
支持向量机(SVM)
在线优化
Pegasos
一种图像敏感对象的识别方法
敏感度计算
特征提取
图像识别
感兴趣对象
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 一种人名识别方法的研究
来源期刊 计算机工程与应用 学科 工学
关键词 最大熵 概率特征 自信度函数 评测
年,卷(期) 2008,(21) 所属期刊栏目 机器学习
研究方向 页码范围 157-161
页数 5页 分类号 TP391
字数 6236字 语种 中文
DOI 10.3778/j.issn.1002-8331.2008.21.044
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王小捷 北京邮电大学信息工程学院 35 179 8.0 11.0
2 张素香 华北电力大学电子与通信工程系 17 355 8.0 17.0
3 张素贤 河北大学卫生职业技术学院 4 10 1.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (10)
共引文献  (109)
参考文献  (4)
节点文献
引证文献  (8)
同被引文献  (23)
二级引证文献  (12)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(3)
  • 参考文献(1)
  • 二级参考文献(2)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(3)
  • 参考文献(1)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(2)
  • 二级参考文献(0)
2008(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2008(1)
  • 引证文献(1)
  • 二级引证文献(0)
2009(1)
  • 引证文献(1)
  • 二级引证文献(0)
2010(3)
  • 引证文献(3)
  • 二级引证文献(0)
2011(5)
  • 引证文献(1)
  • 二级引证文献(4)
2012(1)
  • 引证文献(0)
  • 二级引证文献(1)
2013(3)
  • 引证文献(1)
  • 二级引证文献(2)
2015(2)
  • 引证文献(1)
  • 二级引证文献(1)
2016(1)
  • 引证文献(0)
  • 二级引证文献(1)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2019(1)
  • 引证文献(0)
  • 二级引证文献(1)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
最大熵
概率特征
自信度函数
评测
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与应用
半月刊
1002-8331
11-2127/TP
大16开
北京619信箱26分箱
82-605
1964
chi
出版文献量(篇)
39068
总下载数(次)
102
总被引数(次)
390217
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导