作者:
基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
命名实体识别的目的是识别文本中的实体指称的边界和类别.在进行命名实体识别模型训练的过程中,通常需要大量的标注样本.本文通过实现有效的选择算法,从大量样本中选择适合模型更新的样本,减少对样本的标注工作.通过5组对比实验,验证使用有效的选择算法能够获得更好的样本集,实现具有针对性的标注样本.通过设计在微博网络数据集上的实验,验证本文提出的基于流的主动学习算法可以针对大量互联网文本数据选择出更合适的样本集,能够有效减少人工标注的成本.本文通过2个模型分别实现实体的边界提取和类别区分.序列标注模型提取出实体在序列中的位置,实体分类模型实现对标注结果的分类,并利用主动学习的方法实现在无标注数据集上的训练.使用本文的训练方法在2个数据集上进行实验.在Weibo数据集上的实验展示算法能从无标签数据集中学习到文本特征.在MSRA数据集上的实验结果显示,在预训练数据集的比例达到40%以上时,模型在测试数据集上的F1值稳定在90%左右,与使用全部数据集的结果接近,说明模型在无标签数据集上具有一定的特征提取能力.
推荐文章
BioTrHMM:基于迁移学习的生物医学命名实体识别算法
迁移学习
隐马尔可夫模型
命名实体识别
文本挖掘
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
基于深度学习的医疗命名实体识别
实体识别
数据挖掘
深度学习
医疗信息
一种基于命名实体识别的需求跟踪方法
需求跟踪
命名实体识别
语义聚类
自然语言处理
权重计算
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于主动学习的命名实体识别算法
来源期刊 计算机与现代化 学科
关键词 命名实体识别 主动学习 深度学习 Bi-LSTM
年,卷(期) 2021,(7) 所属期刊栏目 算法设计与分析|DESIGN AND ANALYSIS OF ALGORITHM
研究方向 页码范围 18-22
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1006-2475.2021.07.004
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (92)
共引文献  (20)
参考文献  (16)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(2)
  • 参考文献(0)
  • 二级参考文献(2)
2003(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(7)
  • 参考文献(0)
  • 二级参考文献(7)
2007(2)
  • 参考文献(1)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(8)
  • 参考文献(1)
  • 二级参考文献(7)
2010(8)
  • 参考文献(0)
  • 二级参考文献(8)
2011(6)
  • 参考文献(1)
  • 二级参考文献(5)
2012(3)
  • 参考文献(0)
  • 二级参考文献(3)
2013(2)
  • 参考文献(1)
  • 二级参考文献(1)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(13)
  • 参考文献(0)
  • 二级参考文献(13)
2016(6)
  • 参考文献(0)
  • 二级参考文献(6)
2017(16)
  • 参考文献(1)
  • 二级参考文献(15)
2018(9)
  • 参考文献(3)
  • 二级参考文献(6)
2019(12)
  • 参考文献(5)
  • 二级参考文献(7)
2020(2)
  • 参考文献(2)
  • 二级参考文献(0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
命名实体识别
主动学习
深度学习
Bi-LSTM
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机与现代化
月刊
1006-2475
36-1137/TP
大16开
南昌市井冈山大道1416号
44-121
1985
chi
出版文献量(篇)
9036
总下载数(次)
25
总被引数(次)
56782
论文1v1指导