原文服务方: 计算机应用研究       
摘要:
生物医疗文本中的命名实体识别对于构建和挖掘大型临床数据库以服务于临床决策具有重要意义,而其中一个基础工作是疾病名称的识别。医疗文本中存在大量的复合疾病名称,难以分离抽取出其中的实体。针对这一问题,提出一种基于多标签的条件随机场算法,首先对数据标注多层标签,每层标签针对复合疾病名称中的不同疾病,然后用整合后的最终标签去训练模型,最后再对模型预测的标签进行分离。此方法能够识别传统条件随机场算法无法识别的复合疾病名称,实验结果验证了所提算法的有效性。
推荐文章
基于群集智能的CRF与规则结合的中文地址抽取
条件随机场
地址抽取
规则抽取方法
群集智能
ACG算法
组合
基于CRF算法的汉语比较句识别和关系抽取
比较句
比较关系
CRF模型
比较主体
比较基准
基于BLSTM_attention_CRF模型的新能源汽车领域术语抽取
领域术语抽取
attention机制
双向长短时记忆网络
条件随机场
词典
规则
基于伪标签置信选择的半监督医疗事件抽取
医疗事件抽取
知识图谱
注意力机制
联合抽取
伪标签
电子病历
多数投票
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多标签CRF的疾病名称抽取
来源期刊 计算机应用研究 学科
关键词 命名实体识别 条件随机场 多标签 医疗文本 复合实体
年,卷(期) 2017,(1) 所属期刊栏目 软件技术研究
研究方向 页码范围 118-122
页数 5页 分类号 TP391
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2017.01.025
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 姬东鸿 武汉大学计算机学院 92 887 16.0 26.0
2 王鹏远 武汉大学计算机学院 1 16 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (7)
节点文献
引证文献  (16)
同被引文献  (37)
二级引证文献  (8)
1994(1)
  • 参考文献(1)
  • 二级参考文献(0)
1995(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2015(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(5)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(5)
  • 二级引证文献(0)
2017(5)
  • 引证文献(5)
  • 二级引证文献(0)
2018(2)
  • 引证文献(2)
  • 二级引证文献(0)
2019(7)
  • 引证文献(6)
  • 二级引证文献(1)
2020(10)
  • 引证文献(3)
  • 二级引证文献(7)
研究主题发展历程
节点文献
命名实体识别
条件随机场
多标签
医疗文本
复合实体
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导