基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
本文提出了一种基于规则匹配和机器学习的论文作者名自动化消歧方法:首先基于人工构建的人名匹配规则确定候选作者,对于存在多个候选人的情况,基于论文的属性信息(例如合作者 、标题 、摘要 、关键词和出版物名称等)提取特征,然后选取合适的机器学习算法进行消歧.实验效果表明K近邻和Softmax分类器较适合于论文作者名消歧任务;此外,将作者信息与论文的其他信息分开提取特征能够有效提高作者名消歧的准确性.
推荐文章
基于稀疏分布式表征的英文著者姓名消歧研究
姓名消歧
稀疏分布式表征
语义指纹
层级时序记忆模型
基于义类的无导词义消歧方法的研究
自然语言处理
词义消歧
无导方法
义类
基于融合特征相似度的实体消歧方法研究
实体特征
主题信息
特征相似度
人名消歧
基于知网语义相关度计算的词义消歧方法
汉语自动分词
词义消歧
语义相关度
知网
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于机器学习的论文作者名消歧方法研究
来源期刊 四川大学学报(自然科学版) 学科 工学
关键词 作者名消歧 机器学习 文本特征提取
年,卷(期) 2019,(2) 所属期刊栏目 计算机科学
研究方向 页码范围 241-245
页数 5页 分类号 TP391.1
字数 4310字 语种 中文
DOI 10.3969/j.issn.0490-6756.2019.02.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张治坤 北京大学计算中心 16 99 4.0 9.0
2 袁玲 北京大学计算中心 7 27 3.0 5.0
3 彭一明 北京大学计算中心 11 96 5.0 9.0
4 姜宁 北京大学计算中心 12 95 5.0 9.0
5 邓可君 北京大学计算中心 2 2 1.0 1.0
6 华凯 北京大学计算中心 1 1 1.0 1.0
7 邓昌明 北京大学计算中心 4 12 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (27)
共引文献  (28)
参考文献  (8)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (0)
1958(1)
  • 参考文献(0)
  • 二级参考文献(1)
1969(1)
  • 参考文献(0)
  • 二级参考文献(1)
1975(1)
  • 参考文献(1)
  • 二级参考文献(0)
1988(1)
  • 参考文献(1)
  • 二级参考文献(0)
1989(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(2)
  • 参考文献(0)
  • 二级参考文献(2)
2011(4)
  • 参考文献(0)
  • 二级参考文献(4)
2012(3)
  • 参考文献(1)
  • 二级参考文献(2)
2013(4)
  • 参考文献(1)
  • 二级参考文献(3)
2014(2)
  • 参考文献(0)
  • 二级参考文献(2)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(6)
  • 参考文献(2)
  • 二级参考文献(4)
2018(2)
  • 参考文献(2)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2020(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
作者名消歧
机器学习
文本特征提取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
四川大学学报(自然科学版)
双月刊
0490-6756
51-1595/N
大16开
成都市九眼桥望江路29号
62-127
1955
chi
出版文献量(篇)
5772
总下载数(次)
10
总被引数(次)
25503
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导