原文服务方: 北京大学学报医学版       
摘要:
目的:电子病历数据中的主诉、现病史、既往史、鉴别诊断、影像诊断、手术记录等主体内主要采用中文自然语言文字描述,是临床医生实际诊疗细节的具体体现,包含了诊疗细节的大量、丰富信息.本研究目的在于建立一种从中进行有效信息提取并组织成可分析利用的形式,供目前医学数据处理、医学研究之用.方法:基于医院的真实电子病历数据,设计定制化的基于规则学习及信息抽取方法,采用三个步骤实现中文信息的抽取:(1)抽样标注,随机抽取600份电子病历的病史信息(包括现病史、既往史、个人史、家族史等),采用本研究开发的标注平台,对其中需要抽取的信息(以糖尿病史为实例)进行标注;(2)根据标注结果,进行抽取模版归纳,并将抽取模版进行重写,生成可以直接用于抽取的Perl语言正则表达式抽取规则,并利用这些规则进行实际信息抽取;(3)对抽取结果进行人工验证与自动化验证相结合的方法,对方法的有效性进行验证.结果:所设计方法已在国家医疗数据中心平台上实现,并针对糖尿病病史抽取在医院进行了单个科室的现场验证,2015年1 436份糖尿病患者病历的病史抽取结果为召回率87.6%、准确率99.5%、F分数(F-Score)0.93;全体糖尿病患者10%抽样病历共1 223份的抽取结果为召回率89.2%、准确率99.2%、F-Score 0.94,效果较好.结论:主要采用自然语言处理与基于规则的信息抽取相结合的方法,设计并实现了从非结构化的中文电子病历文本数据中抽取定制化信息的算法,与已有工作比对效果较好.
推荐文章
结构化电子病历的应用探讨
电子病历
结构化
病历质控
科研
浅析结构化电子病历系统的应用和体会
结构化
电子病历
质量控制
结构化电子病历在护理文书管理中的应用效果
结构化电子病历
护理文书
质量管理
结构化电子病历的敏感数据保护方法探讨
电子病历
结构化
敏感数据
基于角色的权限访问控制模型
规则引擎
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 非结构化电子病历中信息抽取的定制化方法
来源期刊 北京大学学报医学版 学科
关键词 病案系统,计算机化 信息获取 糖尿病 病史记录
年,卷(期) 2018,(2) 所属期刊栏目 论著
研究方向 页码范围 256-263
页数 8页 分类号 R319
字数 语种 中文
DOI 10.3969/j.issn.1671-167X.2018.02.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 李岩 89 527 12.0 17.0
3 张凯 北京大学基础医学院 67 513 13.0 20.0
4 牛承志 郑州大学第一附属医院信息处 10 31 3.0 5.0
5 包小源 北京大学医学信息学中心 16 153 6.0 12.0
7 金梦 北京大学医学信息学中心 9 21 2.0 4.0
13 黄婉晶 北京大学数学科学学院 1 10 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (100)
参考文献  (14)
节点文献
引证文献  (10)
同被引文献  (39)
二级引证文献  (3)
2001(3)
  • 参考文献(0)
  • 二级参考文献(3)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(0)
  • 二级参考文献(2)
2006(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(1)
  • 参考文献(1)
  • 二级参考文献(0)
2013(5)
  • 参考文献(5)
  • 二级参考文献(0)
2015(4)
  • 参考文献(4)
  • 二级参考文献(0)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2018(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
2019(4)
  • 引证文献(3)
  • 二级引证文献(1)
2020(8)
  • 引证文献(6)
  • 二级引证文献(2)
研究主题发展历程
节点文献
病案系统,计算机化
信息获取
糖尿病
病史记录
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京大学学报医学版
双月刊
1671-167X
11-4691/R
大16开
1959-01-01
chi
出版文献量(篇)
3297
总下载数(次)
0
论文1v1指导