基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的 针对某三级甲等医院电子病历中的非结构化部分(诊断和病情),建立多特征融合的条件随机场模型,自动化识别用自然语言描述的电子病历(electronic medical records,EMR)中的疾病和症状,从而实现电子病历信息的结构化存储,以利于电子病历的信息挖掘和统计分析.方法 将手动标注的语料库分为训练集和测试集,借助NLPIR工具分割文本,选择CRF++工具进行实验.针对中文电子病历的数据特点,先选取基本特征和相应的特征模板,通过不同上下文窗口的对比实验确定其大小;再分别添加引导词特征和构词结构特征,对比两种高级特征对实验结果的影响.结果 仅选取基本特征,上下文窗口为7时,识别效果最好;添加高级特征后,最终疾病实体F值为92.80%,症状实体F值为94.17%.结论 条件随机场模型融合多种有效的特征,可以很好地识别出电子病历中的疾病和症状实体.本研究对电子病历的命名实体识别有重要的意义.
推荐文章
基于多特征融合的中文电子病历命名实体识别
中文电子病历
命名实体识别
多特征融合
条件随机场
基于位置敏感Embedding的中文命名实体识别
命名实体识别
表示学习
Embedding
多尺度聚类
条件随机场
中文电子病历命名实体标注语料库构建
中文电子病历(CEMR)
命名实体
标注语料库
标注规范
标注一致性(IAA)
采用Transformer-CRF的中文电子病历命名实体识别
电子病历(EMR)
命名实体识别
Transformer
条件随机场(CRF)
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于多特征融合的中文电子病历命名实体识别
来源期刊 北京生物医学工程 学科 医学
关键词 电子病历 多特征融合 条件随机场模型 命名实体识别
年,卷(期) 2018,(3) 所属期刊栏目 论著
研究方向 页码范围 279-284,324
页数 7页 分类号 R318.04
字数 5138字 语种 中文
DOI 10.3969/j.issn.1002-3208.2018.03.010
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (46)
共引文献  (60)
参考文献  (14)
节点文献
引证文献  (8)
同被引文献  (34)
二级引证文献  (5)
1996(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(2)
  • 参考文献(0)
  • 二级参考文献(2)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(5)
  • 参考文献(0)
  • 二级参考文献(5)
2007(4)
  • 参考文献(0)
  • 二级参考文献(4)
2008(8)
  • 参考文献(1)
  • 二级参考文献(7)
2009(4)
  • 参考文献(1)
  • 二级参考文献(3)
2010(7)
  • 参考文献(4)
  • 二级参考文献(3)
2011(3)
  • 参考文献(2)
  • 二级参考文献(1)
2012(2)
  • 参考文献(0)
  • 二级参考文献(2)
2013(7)
  • 参考文献(1)
  • 二级参考文献(6)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(4)
  • 参考文献(3)
  • 二级参考文献(1)
2016(2)
  • 参考文献(2)
  • 二级参考文献(0)
2018(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2019(7)
  • 引证文献(5)
  • 二级引证文献(2)
2020(6)
  • 引证文献(3)
  • 二级引证文献(3)
研究主题发展历程
节点文献
电子病历
多特征融合
条件随机场模型
命名实体识别
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京生物医学工程
双月刊
1002-3208
11-2261/R
16开
北京安定门外安贞医院
1981
chi
出版文献量(篇)
2829
总下载数(次)
13
总被引数(次)
15960
论文1v1指导