基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
[目的]为推动精准医学研究的发展,世界各国相继开展大规模人群队列基因组测序计划,通过对数以万计个体进行全基因组测序,构建人群特异的基因组变异图谱.这些海量基因组数据产出,对计算速度和计算通量提出了新的要求,迫切需要速度更快、通量更高的计算平台来处理与解读这些生物序列信息.由于基因组数据自身的特点、数据解析过程的多样性和复杂性,致使在大规模人群基因组变异解析中高通量计算资源的使用效率低、计算速度慢、耗时长,服务器与本地数据交换不便,因此需要针对基因组变异解析进行多方面优化,通过软硬件开发来解决应用中存在的多种问题.本文拟对这些优化方法进行分析和综述.[方法]在高通量计算系统中,系统IO瓶颈问题是基因组变异解析并行化效率低的主要原因,通常采用基于分布式非结构化存储数据库以及对象存储系统,以提升IO的大规模可扩展能力,解决分析流程中存在的IO问题;同时通过基因组数据的高效压缩算法,可减少数据IO和传输压力.为了加快基因组数据解析速度,可在软件上采用神经网络等算法优化基因组解析方法,在硬件上使用FPGA(现场可编程逻辑门阵列)或GPU异构计算,以提高数据处理速度.[结果]综合来看,以上多方面的优化可以大幅提升基因组数据分析中高通量计算的性能,解决基因组数据处理中的存储墙问题,提高高通量计算资源的使用效率,大大减少全基因组变异解析的计算时间.[结论]高通量计算在基因组数据解析应用中存在的多种问题,可通过软硬件开发和优化得以解决,从而显著改进高通量计算在大规模人群队列变异解析应用中的计算效率,促进今后人群队列基因组研究与应用的广泛开展.
推荐文章
高通量计算与机器学习驱动高熵 合金的研究进展
高熵合金
热力学
第一性原理
机器学习
性能优化
高通量PCR模板植物基因组DNA制备方法
基因组DNA制备
PCR
基因分型
高通量转录组测序的数据分析与基因发掘
转录组测序
数据分析
基因发掘
利用高通量测序技术分析核桃基因组微卫星特征1)
核桃
微卫星
碱基重复类型
长度分化
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 高通量计算在大规模人群队列基因组数据解析应用中的挑战
来源期刊 数据与计算发展前沿 学科
关键词 高通量计算 IO性能 基因组变异解析 异构加速 数据压缩
年,卷(期) 2020,(1) 所属期刊栏目 专刊:高性能与高通量计算及应用
研究方向 页码范围 117-127
页数 11页 分类号
字数 6796字 语种 中文
DOI 10.11871/jfdc.issn.2096-742X.2020.01.010
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 曾瀞瑶 中国科学院北京基因组研究所国家基因组科学数据中心 2 0 0.0 0.0
2 苑娜 中国科学院北京基因组研究所国家基因组科学数据中心 1 0 0.0 0.0
3 魏文娟 1 0 0.0 0.0
4 李根 1 0 0.0 0.0
5 杜政霖 中国科学院北京基因组研究所国家基因组科学数据中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (111)
共引文献  (0)
参考文献  (26)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
1967(1)
  • 参考文献(0)
  • 二级参考文献(1)
1977(1)
  • 参考文献(1)
  • 二级参考文献(0)
1979(1)
  • 参考文献(0)
  • 二级参考文献(1)
1984(1)
  • 参考文献(0)
  • 二级参考文献(1)
1993(1)
  • 参考文献(0)
  • 二级参考文献(1)
1994(4)
  • 参考文献(1)
  • 二级参考文献(3)
1995(1)
  • 参考文献(0)
  • 二级参考文献(1)
1996(3)
  • 参考文献(0)
  • 二级参考文献(3)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(2)
  • 参考文献(0)
  • 二级参考文献(2)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(3)
  • 参考文献(0)
  • 二级参考文献(3)
2006(4)
  • 参考文献(1)
  • 二级参考文献(3)
2007(3)
  • 参考文献(0)
  • 二级参考文献(3)
2008(1)
  • 参考文献(0)
  • 二级参考文献(1)
2009(6)
  • 参考文献(1)
  • 二级参考文献(5)
2010(7)
  • 参考文献(2)
  • 二级参考文献(5)
2011(7)
  • 参考文献(2)
  • 二级参考文献(5)
2012(17)
  • 参考文献(3)
  • 二级参考文献(14)
2013(21)
  • 参考文献(2)
  • 二级参考文献(19)
2014(6)
  • 参考文献(1)
  • 二级参考文献(5)
2015(16)
  • 参考文献(4)
  • 二级参考文献(12)
2016(10)
  • 参考文献(2)
  • 二级参考文献(8)
2017(10)
  • 参考文献(1)
  • 二级参考文献(9)
2018(6)
  • 参考文献(4)
  • 二级参考文献(2)
2019(1)
  • 参考文献(1)
  • 二级参考文献(0)
2020(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
高通量计算
IO性能
基因组变异解析
异构加速
数据压缩
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
数据与计算发展前沿
双月刊
2096-742X
10-1649/TP
大16开
北京市海淀区中关村南四街4号
2-493
2008
chi
出版文献量(篇)
135
总下载数(次)
3
总被引数(次)
9
论文1v1指导