基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
针对中文医疗文献中的中文词边界模糊、分词歧义导致传统深度学习方法难以获取词汇语义信息的问题,提出了一种融合嵌入字词特征的中文医疗命名实体识别模型.首先,针对词向量缺失边界特征的问题,将词向量与词性、词边界特征拼接融合,结合注意力机制捕获字符间潜在的依赖权重等特征和增强词汇向量;其次,将通过BERT模型获得的字符向量与增强词汇向量拼接融合作为嵌入的基础上,利用BiLSTM模型提取上下文语义信息特征;最后通过CRF模型进行序列解码.利用瑞金医院标准化代谢性疾病管理中心(MMC)的糖尿病标注数据集对融合嵌入字词特征的中文医疗命名实体识别模型进行实验,获得了较好的结果.
推荐文章
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
基于BLSTM-CRF中文领域命名实体识别框架设计
BLSTM-CRF
CBOW
Boson
命名实体识别
融合词位字向量的军事领域命名实体识别
军事
命名实体识别
词位字向量
BI-GRU-CRF
深度神经网络
序列标注
基于深度学习的医疗命名实体识别
实体识别
数据挖掘
深度学习
医疗信息
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 融合嵌入字词特征的中文医疗命名实体识别
来源期刊 中华医学图书情报杂志 学科 医学
关键词 中文医疗命名实体识别 注意力机制 字词特征融合 BiLSTM模型 CRF模型
年,卷(期) 2021,(9) 所属期刊栏目 情报研究与方法
研究方向 页码范围 42-49
页数 8页 分类号 TP391.1|R319
字数 语种 中文
DOI 10.3969/j.issn.1671-3982.2021.09.005
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (0)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2021(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
中文医疗命名实体识别
注意力机制
字词特征融合
BiLSTM模型
CRF模型
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中华医学图书情报杂志
月刊
1671-3982
11-4745/R
大16开
北京市海淀区西四环中路59号
2-714
1991
chi
出版文献量(篇)
5113
总下载数(次)
5
论文1v1指导