基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
目前的手术病例都是以文本的方式记录的.这些文本中包含了大量对日后分析和挖掘有用的信息.通过对大量手术文本进行分析,对手术病例进行数据化和结构化,医院可以对整体病情趋势进行把握并挖掘大量对诊断有用的信息.而在针对具体病人确定手术方案时,也往往需要分析病人的历史病历,根据以前的手术情况来确定新的诊断方案.尤其对于肺部或胸腔的手术来说,确定历史手术的出血量、切除部位、切口数目以及切除范围等内容对医生制定新的手术方案具有重要意义.从历史病例中自动抽取出这些信息,将有效节省医生阅读病例的时间,进而可以让医生把更多的时间用于诊疗方案的制定上.本文重点研究胸腔手术病例中切口数量抽取问题.针对手术病例中并不直接包含切口数量以致无法直接抽取的难点,本文将切口数量抽取问题转换为文本分类问题.基于文本分类的思想,首先针对病例文本中的句子着手研究,先对文本进行分句处理,选择包含切口信息的句子作为切口描述句,并基于双向LSTM(长短期记忆神经网络,Long Short Term Memory)神经网络与Attention(注意力)机制构建分句切口数目提取模型,逐个判定文本中切口描述句所记录的切口数目,最后累加切口数目.此后本文进一步构建层次化切口数目提取模型,首先针对单个句子构建双向LSTM网络作为句子层,并对句子层的输出再次进行过滤作为段落层的输入,构建LSTM神经网络作为段落层,段落层的最终输出降维得出分类结果.实验结果表明,两种切口数目判定方法准确率均可达到98%,超出其他的多种文本分类模型如SVM(支持向量机)以及卷积模型(TextCNN),且后者可拓展性与整体性更佳.
推荐文章
基于证券行业半结构化数据的抽取技术
数据抽取
半结构化
数据挖掘
证券投资
非结构化电子病历中信息抽取的定制化方法
病案系统,计算机化
信息获取
糖尿病
病史记录
基于DOM的半结构化网页信息抽取算法
DOM
信忠抽取
半结构化
信息集成
RE-OEM:一种半结构化生物数据的信息抽取模型
半结构化
生物数据
抽取模型
OEM数据模型
正则表达式
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 手术病例中结构化数据抽取研究
来源期刊 计算机学报 学科 工学
关键词 数目提取 文本分类 LSTM 双向LSTM 注意力机制
年,卷(期) 2019,(12) 所属期刊栏目 数据科学与工程
研究方向 页码范围 2754-2768
页数 15页 分类号 TP18
字数 16508字 语种 中文
DOI 10.11897/SP.J.1016.2019.02754
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 卢淑祺 中国人民大学信息学院 2 0 0.0 0.0
2 窦志成 中国人民大学大数据管理与分析方法研究北京市重点实验室 7 1 1.0 1.0
3 文继荣 2 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (116)
共引文献  (45)
参考文献  (21)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1972(1)
  • 参考文献(0)
  • 二级参考文献(1)
1982(1)
  • 参考文献(0)
  • 二级参考文献(1)
1983(1)
  • 参考文献(0)
  • 二级参考文献(1)
1986(1)
  • 参考文献(0)
  • 二级参考文献(1)
1990(2)
  • 参考文献(0)
  • 二级参考文献(2)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(4)
  • 参考文献(0)
  • 二级参考文献(4)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2000(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(6)
  • 参考文献(0)
  • 二级参考文献(6)
2002(4)
  • 参考文献(0)
  • 二级参考文献(4)
2003(3)
  • 参考文献(0)
  • 二级参考文献(3)
2004(7)
  • 参考文献(0)
  • 二级参考文献(7)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(2)
  • 参考文献(0)
  • 二级参考文献(2)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(5)
  • 参考文献(1)
  • 二级参考文献(4)
2009(3)
  • 参考文献(0)
  • 二级参考文献(3)
2010(9)
  • 参考文献(2)
  • 二级参考文献(7)
2011(9)
  • 参考文献(0)
  • 二级参考文献(9)
2012(13)
  • 参考文献(1)
  • 二级参考文献(12)
2013(10)
  • 参考文献(0)
  • 二级参考文献(10)
2014(14)
  • 参考文献(3)
  • 二级参考文献(11)
2015(13)
  • 参考文献(1)
  • 二级参考文献(12)
2016(10)
  • 参考文献(5)
  • 二级参考文献(5)
2017(8)
  • 参考文献(8)
  • 二级参考文献(0)
2019(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数目提取
文本分类
LSTM
双向LSTM
注意力机制
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机学报
月刊
0254-4164
11-1826/TP
大16开
中国科学院计算技术研究所(北京2704信箱)
2-833
1978
chi
出版文献量(篇)
5154
总下载数(次)
49
总被引数(次)
187004
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导