基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
命名实体识别任务能够搭建知识库与自然语言之间的桥梁,为关键字提取、机器翻译、主题检测与跟踪等研究工作提供支撑.通过对目前命名实体识别领域的相关研究进行分析,提出了一套通用的命名实体识别优化方案.首先,设计并实现了利用候选集的增量式扩展方法,降低了对训练集的依赖性;其次,通过点互信息率对实体上下文进行特征选择,大幅度降低了上下文空间,同时提高了标注性能;最后,提出了基于主题向量的二次消歧方法,进一步增强了标注准确率.通过在广泛使用的开源命名实体识别系统DBpedia Spot-light上进行多种比较实验,验证了所提优化方案与已有系统相比具有较优的性能指标.
推荐文章
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
融合词位字向量的军事领域命名实体识别
军事
命名实体识别
词位字向量
BI-GRU-CRF
深度神经网络
序列标注
命名实体识别和指代消解在文摘系统中的应用
自动文摘
命名实体识别
指代消解
基于条件随机场的汉语命名实体识别
可视化工作室2008
条件随机场
汉语分词
命名实体识别
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 DBpedia Spotlight上的命名实体识别优化
来源期刊 计算机科学与探索 学科 工学
关键词 命名实体识别 链接数据 DBpediaSpotlight
年,卷(期) 2017,(7) 所属期刊栏目 学术研究
研究方向 页码范围 1044-1055
页数 12页 分类号 TP391
字数 10342字 语种 中文
DOI 10.3778/j.issn.1673-9418.1607015
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 徐强 天津大学计算机科学与技术学院 56 443 12.0 18.0
3 冯志勇 146 1072 17.0 24.0
5 王鑫 天津大学计算机科学与技术学院 56 364 10.0 16.0
11 付宇新 天津大学计算机科学与技术学院 3 7 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (1)
节点文献
引证文献  (1)
同被引文献  (6)
二级引证文献  (1)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
命名实体识别
链接数据
DBpediaSpotlight
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学与探索
月刊
1673-9418
11-5602/TP
大16开
北京市海淀区北四环中路211号北京619信箱26分箱
82-560
2007
chi
出版文献量(篇)
2215
总下载数(次)
4
总被引数(次)
10748
论文1v1指导