基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
中医临床病历是中医重要的科研数据资源,但目前临床病历仍以文本为主要表达形式,对病历数据深入分析的前提是进行结构化信息抽取,而命名实体抽取是其基础性步骤。针对中医临床病历的命名实体,如症状、疾病和诱因等的抽取问题,通过手工标注的413份病历数据(以中文字为特征)与4类特征模版,将条件随机场( CRF)、隐马尔科夫模型( HMM)和最大熵马尔科夫模型( MEMM)用于中医病历命名实体抽取的实验,并进行比较分析。结果表明,结合合适的特征模版,CRF命名实体抽取方法取得了较好的性能,F1值的症状达到0.80,疾病名称达到0.74,诱因0.74。与HMM和MEMM相比,CRF有最高的准确率和召回率,是一种较为适用的中医临床病历命名实体抽取方法。
推荐文章
基于条件随机场的农业命名实体识别研究
农业命名实体识别
CRF模型
特征选择
基于条件随机场的汉语命名实体识别
可视化工作室2008
条件随机场
汉语分词
命名实体识别
基于条件随机场的网络评论与事件中命名实体匹配研究
条件随机场
命名实体
变体形式
综合相似度
临床医学命名实体识别的病历质量筛选标准研究
电子病历
临床医学命名实体
病历质量
筛选标准
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于条件随机场的中医临床病历命名实体抽取
来源期刊 计算机工程 学科 工学
关键词 中医临床病历 命名实体抽取 语料库标注系统 条件随机场 特征模板
年,卷(期) 2014,(9) 所属期刊栏目 ?开发研究与工程应用?
研究方向 页码范围 312-316
页数 5页 分类号 TP391
字数 4707字 语种 中文
DOI 10.3969/j.issn.1000-3428.2014.09.062
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 周雪忠 北京交通大学计算机与信息技术学院 53 1039 17.0 31.0
5 刘凯 北京交通大学计算机与信息技术学院 138 1534 21.0 33.0
6 于剑 北京交通大学计算机与信息技术学院 68 1099 12.0 32.0
10 张润顺 62 902 15.0 28.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (5)
节点文献
引证文献  (25)
同被引文献  (69)
二级引证文献  (55)
2002(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(2)
  • 引证文献(2)
  • 二级引证文献(0)
2016(8)
  • 引证文献(7)
  • 二级引证文献(1)
2017(8)
  • 引证文献(3)
  • 二级引证文献(5)
2018(22)
  • 引证文献(8)
  • 二级引证文献(14)
2019(27)
  • 引证文献(3)
  • 二级引证文献(24)
2020(13)
  • 引证文献(2)
  • 二级引证文献(11)
研究主题发展历程
节点文献
中医临床病历
命名实体抽取
语料库标注系统
条件随机场
特征模板
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程
月刊
1000-3428
31-1289/TP
大16开
上海市桂林路418号
4-310
1975
chi
出版文献量(篇)
31987
总下载数(次)
53
总被引数(次)
317027
论文1v1指导