基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着越来越多的医院开展数字化建设以及区域医疗应用范围的扩大,大量非结构化、半结构化医疗数据爆发式的增长,传统的技术架构在处理海量数据方面显得越来越乏力。深圳市区域卫生信息化数据交换平台,覆盖了全市60家公立医院、600多家社区卫生机构。平台接入近50个异构系统,现有1700多万份健康档案、30亿条以上诊疗数据,平均每天产生500万以上的小文件。针对深圳市卫生区域信息化建设,海量小文件交换处理效率低下的问题,利用Hadoop平台,提出了采用时间基线归档文件技术和序列文件技术解决小文件存储、检索效率问题的解决方案,经验证实该技术可满足实际业务应用中对数据交换的需要。详细描述了该技术的实现细节,包括根据业务数据规模划定时间基线,根据业务需求定制数据类型、数据结构,将小文件合并分块存储,建立小文件到大文件的映射以及相关数据交换处理流程等,并基于真实数据对该技术进行了评测比较,结果表明上述技术与常规技术相比明显提升了批量处理小文件的效率。
推荐文章
国产化环境下的海量小文件数据分布式存储技术
国产化环境
海量小文件数据
数据合并
数据迁移
分布式存储技术
一种面向HDFS中海量小文件的存取优化方法
海量小文件
文件相关性
合并
预取
一种基于HDFS小文件存储优化方案
Hadoop
HDFS
小文件
缓存
基于NoSQL的海量航空物流小文件分布式多级存储方法
小文件
Redis
HDFS
多级存储
预取机制
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于时间线优化医疗海量小文件数据集成技术
来源期刊 中国数字医学 学科 医学
关键词 医疗数据 时间基线 批量小文件 数据集成技术
年,卷(期) 2014,(8) 所属期刊栏目 【数据库技术与应用】Database Technology and Application
研究方向 页码范围 89-92
页数 4页 分类号 R319
字数 4036字 语种 中文
DOI 10.3969/j.issn.1673-7571.2014.08.030
五维指标
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (18)
共引文献  (15)
参考文献  (5)
节点文献
引证文献  (2)
同被引文献  (2)
二级引证文献  (4)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2007(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(2)
  • 参考文献(0)
  • 二级参考文献(2)
2010(9)
  • 参考文献(1)
  • 二级参考文献(8)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(3)
  • 参考文献(2)
  • 二级参考文献(1)
2013(1)
  • 参考文献(1)
  • 二级参考文献(0)
2014(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(2)
  • 引证文献(0)
  • 二级引证文献(2)
2019(2)
  • 引证文献(1)
  • 二级引证文献(1)
研究主题发展历程
节点文献
医疗数据
时间基线
批量小文件
数据集成技术
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
中国数字医学
月刊
1673-7571
11-5550/R
大16开
北京市朝阳区光华路甲8号和乔大厦A座528A室
80-133
2006
chi
出版文献量(篇)
6783
总下载数(次)
21
总被引数(次)
25598
论文1v1指导