基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
职业是人物实体的代表性特征,能够有效地区分人物实体.传统人名消歧算法仅把职业当作一个普通的特征,忽视了它的重要性.针对以上问题,提出了基于职业特征的人名消歧算法.首先通过互联网手动构建基础职业词典;其次以维基百科的所有中文页面为训练语料,通过词激活力模型扩展基础职业词典得到职业特征词典;然后从文本中提取职业特征,并抽取人名和作品名作为其补充特征,弥补文本中职业特征缺失和同一人物具有多个职业的问题;最后采用凝聚层次聚类实现人名消歧.在CLP2010的人名消歧训练语料上进行实验,结果表明文章算法能够有效地实现人名消歧.
推荐文章
基于聚类集成的人名消歧算法
聚类集成
人名消歧
凝聚层次聚类
相似度矩阵
基于句义结构分析的中文人名消歧
人名消歧
社会关系
句义结构
辅助特征
聚类
采用改进最长公共子序列的人名消歧
人名消歧
文本相似度
最长公共子序列
层次聚类
基于分步聚类的人名消歧算法
人名消歧
特征稀疏
文本检索
凝聚层次聚类
相似度阈值
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于职业特征的人名消歧算法
来源期刊 信息工程大学学报 学科 工学
关键词 职业特征 亲和度 人名消歧 词激活力 凝聚层次聚类
年,卷(期) 2016,(5) 所属期刊栏目 信息处理技术
研究方向 页码范围 548-554
页数 7页 分类号 TP391.1
字数 6808字 语种 中文
DOI 10.3969/j.issn.1671-0673.2016.05.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李弼程 102 1583 19.0 37.0
2 周杰 11 104 4.0 10.0
3 阳怡林 2 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (9)
共引文献  (21)
参考文献  (9)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1992(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(4)
  • 参考文献(3)
  • 二级参考文献(1)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2016(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
职业特征
亲和度
人名消歧
词激活力
凝聚层次聚类
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
信息工程大学学报
双月刊
1671-0673
41-1196/N
大16开
郑州市科学大道62号
2000
chi
出版文献量(篇)
2792
总下载数(次)
2
总被引数(次)
9088
论文1v1指导