基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对警情领域关键实体信息难以识别的问题,提出一种基于BERT的神经网络模型BERT-BiLSTM-Attention-CRF用于识别和提取相关命名实体,且针对不同案由设计了相应的实体标记注规范.该模型使用BERT预训练词向量代替传统Skip-gram和CBOW等方式训练的静态词向量,提升了词向量的表证能力,同时解决了中文语料采用字向量训练时词语边界的划分问题;还使用注意力机制改进经典的命名实体识别(NER)模型架构BiLSTM-CRF.BERT-BiLSTM-Attention-CRF模型在测试集上的准确率达91%,较CRF++的基准模型提高7%,也高于BiLSTM-CRF模型86%的准确率,其中相关人名、损失金额、处理方式等实体的F1值均高于0.87.
推荐文章
基于E-CNN和BLSTM-CRF的临床文本命名实体识别
命名实体识别
临床文本
集成的卷积神经网络
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
一种基于命名实体识别的需求跟踪方法
需求跟踪
命名实体识别
语义聚类
自然语言处理
权重计算
BioTrHMM:基于迁移学习的生物医学命名实体识别算法
迁移学习
隐马尔可夫模型
命名实体识别
文本挖掘
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于BERT的警情文本命名实体识别
来源期刊 计算机应用 学科 工学
关键词 警情文本 命名实体识别 预训练语言模型 标注规范 词向量
年,卷(期) 2020,(2) 所属期刊栏目 第七届CCF大数据学术会议(BigData2019)
研究方向 页码范围 535-540
页数 6页 分类号 TP391.1
字数 6737字 语种 中文
DOI 10.11772/j.issn.1001-9081.2019101717
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 杜渂 18 39 4.0 4.0
3 王孟轩 3 4 1.0 2.0
5 张胜 3 4 1.0 2.0
9 王月 3 4 1.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (1)
共引文献  (34)
参考文献  (7)
节点文献
引证文献  (4)
同被引文献  (19)
二级引证文献  (0)
1989(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2005(1)
  • 参考文献(1)
  • 二级参考文献(0)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(4)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(4)
  • 二级引证文献(0)
2020(4)
  • 引证文献(4)
  • 二级引证文献(0)
研究主题发展历程
节点文献
警情文本
命名实体识别
预训练语言模型
标注规范
词向量
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用
月刊
1001-9081
51-1307/TP
大16开
成都237信箱
62-110
1981
chi
出版文献量(篇)
20189
总下载数(次)
40
论文1v1指导