原文服务方: 计算机应用研究       
摘要:
研究采用任务并行的方法,对FastQ格式文件的压缩程序DSRC (DNA sequence reads compression)进行了加速.这一任务并行算法将DSRC分为数据读入和数据压缩两个独立的任务,而后将数据压缩的统计过程进一步细分为title行数据统计和其他数据统计两个独立任务.研究结合CPU多线程、GPU、MIC(many integrated core),针对title行数据设计了高并行度的统计算法,实现title行数据的并行统计.在维持原有压缩比的情况下,本研究得到的最大压缩通量可以达到144 MBps,最大加速比可达三倍.结果表明,多任务并行的方法可以有效地加速DSRC,而协处理器对DSRC的加速效果并不明显.另外本算法在压缩ILLUMINA和SOLiD测序平台下的FastQ数据时,其加速效果比压缩LS454测序平台的数据更为明显.
推荐文章
高通量DNA测序数据压缩研究进展
计算机应用
DNA测序
下一代测序
重测序
从头测序
高通量测序
数据压缩算法
基于高通量测序数据的微生物检测算法研究进展
高通量测序
微生物检测
生物信息学
算法
基于码书索引变换的高通量DNA序列数据压缩算法
高通量DNA序列
码书索引变换模型
块排序压缩变换
前移编码
信息熵
数据压缩算法
基于高通量测序的短序列生物数据压缩研究
数据压缩
短序列数据压缩
高通量测序
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高通量DNA测序数据的多任务并行压缩算法
来源期刊 计算机应用研究 学科
关键词 多任务并行 多线程 GPU MIC FastQ文件 压缩
年,卷(期) 2015,(7) 所属期刊栏目 算法研究探讨
研究方向 页码范围 2014-2017
页数 4页 分类号 TF311.56|TP301.6
字数 语种 中文
DOI 10.3969/j.issn.1001-3695.2015.07.024
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王婷 中国科学院软件研究所 67 633 10.0 24.0
2 罗海飚 广州中国科学院软件应用技术研究所并行软件研发中心 2 4 2.0 2.0
3 何娜 广州中国科学院软件应用技术研究所并行软件研发中心 1 2 1.0 1.0
4 李家辉 广州中国科学院软件应用技术研究所并行软件研发中心 1 2 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (15)
节点文献
引证文献  (2)
同被引文献  (16)
二级引证文献  (7)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2010(1)
  • 参考文献(1)
  • 二级参考文献(0)
2011(3)
  • 参考文献(3)
  • 二级参考文献(0)
2012(5)
  • 参考文献(5)
  • 二级参考文献(0)
2013(5)
  • 参考文献(5)
  • 二级参考文献(0)
2015(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2016(1)
  • 引证文献(1)
  • 二级引证文献(0)
2017(1)
  • 引证文献(0)
  • 二级引证文献(1)
2018(4)
  • 引证文献(1)
  • 二级引证文献(3)
2019(2)
  • 引证文献(0)
  • 二级引证文献(2)
2020(1)
  • 引证文献(0)
  • 二级引证文献(1)
研究主题发展历程
节点文献
多任务并行
多线程
GPU
MIC
FastQ文件
压缩
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机应用研究
月刊
1001-3695
51-1196/TP
大16开
1984-01-01
chi
出版文献量(篇)
21004
总下载数(次)
0
总被引数(次)
238385
论文1v1指导