基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对传统命名实体识别需要大量标注数据的问题,提出了一种标注语料稀缺条件下的命名实体识别方法.首先,基于远程监督思想,使用2个特殊字典对特定领域文本进行伪标注;然后,使用BERT(来自Transformer的双向编码器表征)模型进行语义平滑扩展,并在含有噪音的伪标注语料中训练AutoNER(自动伪标注的命名实体识别)模型;最后,通过与传统机器学习方法条件的随机场进行试验对比,验证了该方法的有效性.
推荐文章
融合词位字向量的军事领域命名实体识别
军事
命名实体识别
词位字向量
BI-GRU-CRF
深度神经网络
序列标注
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
BioTrHMM:基于迁移学习的生物医学命名实体识别算法
迁移学习
隐马尔可夫模型
命名实体识别
文本挖掘
基于条件随机场的农业命名实体识别研究
农业命名实体识别
CRF模型
特征选择
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向特定标注数据稀缺领域的命名实体识别
来源期刊 指挥信息系统与技术 学科 工学
关键词 命名实体识别 远程监督 语义向量 数据稀缺
年,卷(期) 2019,(5) 所属期刊栏目 第5代指挥信息系统信息服务技术专题
研究方向 页码范围 14-18
页数 5页 分类号 TP391.1
字数 4998字 语种 中文
DOI 10.15908/j.cnki.cist.2019.05.003
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 赵铁军 哈尔滨工业大学计算机科学与技术学院 123 1278 19.0 32.0
2 郑德权 哈尔滨工业大学计算机科学与技术学院 31 356 9.0 18.0
3 刘哲宁 哈尔滨工业大学计算机科学与技术学院 1 0 0.0 0.0
4 朱聪慧 哈尔滨工业大学计算机科学与技术学院 5 9 2.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (109)
共引文献  (292)
参考文献  (7)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1954(1)
  • 参考文献(0)
  • 二级参考文献(1)
1965(1)
  • 参考文献(0)
  • 二级参考文献(1)
1978(2)
  • 参考文献(0)
  • 二级参考文献(2)
1987(1)
  • 参考文献(0)
  • 二级参考文献(1)
1991(1)
  • 参考文献(0)
  • 二级参考文献(1)
1992(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1995(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
1998(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(2)
  • 参考文献(0)
  • 二级参考文献(2)
2001(2)
  • 参考文献(0)
  • 二级参考文献(2)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(5)
  • 参考文献(0)
  • 二级参考文献(5)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(2)
  • 参考文献(0)
  • 二级参考文献(2)
2008(11)
  • 参考文献(0)
  • 二级参考文献(11)
2009(5)
  • 参考文献(0)
  • 二级参考文献(5)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(5)
  • 参考文献(0)
  • 二级参考文献(5)
2012(10)
  • 参考文献(0)
  • 二级参考文献(10)
2013(8)
  • 参考文献(0)
  • 二级参考文献(8)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(9)
  • 参考文献(0)
  • 二级参考文献(9)
2016(9)
  • 参考文献(1)
  • 二级参考文献(8)
2017(9)
  • 参考文献(2)
  • 二级参考文献(7)
2018(4)
  • 参考文献(2)
  • 二级参考文献(2)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
命名实体识别
远程监督
语义向量
数据稀缺
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
指挥信息系统与技术
双月刊
1674-909X
32-1818/TP
16开
南京1406信箱62分箱
28-430
2010
chi
出版文献量(篇)
1287
总下载数(次)
8
总被引数(次)
4322
论文1v1指导