基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
海量生物信息数据的不断涌现迫切需要在数据压缩技术方面进行更多研究,以减轻服务器存储压力和提高网络传输及数据分析的效率.目前虽然已开发出大量数据压缩软件,但对于海量生物信息数据而言,应该选用何种软件和方法进行数据压缩,尚缺乏详细的综合比较分析.本文选择生物信息学领域中GenBank数据库中的典型核酸和蛋白质序列数据库以及典型生物信息软件Blast和EMBOSS为例,采用不同数据压缩软件进行综合比较分析,结果发现经典压缩软件compress的总体压缩效率很高,除压缩比率可接受之外,其压缩时间相对其他软件而言显著减少,甚至比并行化的bzip2(pbzip2)和gzip(pigz)软件的时间还少很多,故可优先考虑使用.7-Zip软件虽然具有最高的压缩比率,但压缩过程十分耗时,可用于数据的长期储存;而采用bzip2、rar以及gzip等软件压缩的文件,虽然压缩比率较7-Zip的偏低,但压缩过程相对而言还比较快速.具体应用中推荐使用经典压缩软件compress以及并行化运行的pbzip2和pigz软件,三者可作为同时兼顾压缩比率和压缩时间的优选.
推荐文章
多媒体数据压缩技术有效分析
多媒体
数据压缩
技术分析
WebGIS中的矢量数据压缩
WebGIS
矢量数据
数据压缩
细胞全能性与数据压缩
细胞全能性
基因
数据压缩
分形
小波变换中图分类呈:TN713
几种常用无损数据压缩算法研究
数据压缩
无损数据压缩
统计压缩算法
字典压缩算法
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 不同压缩程序对海量生物信息数据压缩效率的比较分析
来源期刊 生物信息学 学科 工学
关键词 数据压缩 压缩比率 压缩时间 压缩效率 并行计算
年,卷(期) 2009,(3) 所属期刊栏目
研究方向 页码范围 196-201
页数 6页 分类号 TP31
字数 6609字 语种 中文
DOI 10.3969/j.issn.1672-5565.2009.03.009
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 张成岗 军事医学科学院放射与辐射医学研究所蛋白质组学国家重点实验室 123 1156 18.0 28.0
2 李伟光 军事医学科学院放射与辐射医学研究所蛋白质组学国家重点实验室 10 22 3.0 3.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (6)
共引文献  (9)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1948(1)
  • 参考文献(1)
  • 二级参考文献(0)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(2)
  • 参考文献(0)
  • 二级参考文献(2)
1996(1)
  • 参考文献(1)
  • 二级参考文献(0)
1997(1)
  • 参考文献(1)
  • 二级参考文献(0)
1999(3)
  • 参考文献(0)
  • 二级参考文献(3)
2001(1)
  • 参考文献(1)
  • 二级参考文献(0)
2002(2)
  • 参考文献(2)
  • 二级参考文献(0)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(1)
  • 二级参考文献(0)
2007(1)
  • 参考文献(1)
  • 二级参考文献(0)
2008(2)
  • 参考文献(2)
  • 二级参考文献(0)
2009(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2015(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
数据压缩
压缩比率
压缩时间
压缩效率
并行计算
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
生物信息学
季刊
1672-5565
23-1513/Q
大16开
黑龙江省哈尔滨市西大直街92号哈尔滨工业大学邵逸夫科学馆一楼
14-14
2003
chi
出版文献量(篇)
937
总下载数(次)
6
总被引数(次)
4610
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
论文1v1指导