基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目的:中医临床病历作为重要的临床数据,以文本的形式记录了医生和患者交互的整个过程.目前,在大数据的背景下,针对临床病历所涵盖的主体问题信息如现病史的分析利用相关研究仍有所欠缺.因此,本文针对中医临床病历中的现病史部分展开症状术语抽取方法研究,为临床病历的进一步使用奠定基础.方法:首先通过随机挑选与专家审核的方式获得了12 367份现病史数据,按照疾病种类分成了两组实验,其中糖尿病组包含了4 838份数据,脾胃病组7 529份数据,以及合并后的混合组12 367份数据.并整理出了一份涵盖22 996个词的症状术语字典.然后选取滑动窗口特征、词的前后缀特征、词典特征等5种特征模板,使用CRFs模型开展症状术语命名实体抽取实验.结果:在实验结果评价标准(准确率、召回率和F1值)上的表现:在开放测试上的评价结果为(0.83、0.8、0.82)、(0.9、0.9、0.89)和(0.88、0.87、0.87);在十重交叉验证上的评价结果为(0.83、0.82、0.83)、(0.95、0.95、0.95)和(0.93、0.92、0.92).结论:CRFs模型作为一种优秀的序列标注算法,适用于现病史文本的症状术语命名实体抽取任务.
推荐文章
基于E-CNN和BLSTM-CRF的临床文本命名实体识别
命名实体识别
临床文本
集成的卷积神经网络
基于条件随机场的中医临床病历命名实体抽取
中医临床病历
命名实体抽取
语料库标注系统
条件随机场
特征模板
基于上下文信息的中文命名实体消歧方法研究
命名实体
语义知识库
聚类
语义列表
基于中文维基百科的命名实体消歧方法
命名实体消歧
词义消歧
中文维基百科
中文信息处理
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 面向中医临床现病史文本的命名实体抽取方法研究
来源期刊 世界科学技术-中医药现代化 学科 医学
关键词 中医临床病历 现病史 条件随机场 特征模板 命名实体抽取
年,卷(期) 2017,(1) 所属期刊栏目 专题讨论二:真实世界临床数据处理与分析
研究方向 页码范围 70-77
页数 8页 分类号 R29
字数 5227字 语种 中文
DOI 10.11842/wst.2017.01.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周雪忠 北京交通大学计算机与信息技术学院 53 1039 17.0 31.0
3 张润顺 62 902 15.0 28.0
4 李晓东 62 399 10.0 17.0
7 袁玉虎 北京交通大学计算机与信息技术学院 2 9 2.0 2.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (5)
共引文献  (17)
参考文献  (6)
节点文献
引证文献  (7)
同被引文献  (10)
二级引证文献  (2)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2004(2)
  • 参考文献(1)
  • 二级参考文献(1)
2009(1)
  • 参考文献(0)
  • 二级参考文献(1)
2010(3)
  • 参考文献(1)
  • 二级参考文献(2)
2014(3)
  • 参考文献(3)
  • 二级参考文献(0)
2017(1)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(1)
  • 二级引证文献(0)
2018(3)
  • 引证文献(3)
  • 二级引证文献(0)
2019(3)
  • 引证文献(2)
  • 二级引证文献(1)
2020(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
中医临床病历
现病史
条件随机场
特征模板
命名实体抽取
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
世界科学技术-中医药现代化
月刊
1674-3849
11-5699/R
大16开
北京市海淀区中关村东路55号思源楼12层
2-534
1999
chi
出版文献量(篇)
5712
总下载数(次)
7
总被引数(次)
41879
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导