基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
[目的]对现有的下一代测序(Next Generation Sequencing,NGS)纠错算法和工具进行分析,提出基于Hadoop平台的纠错算法,以解决大数据处理中计算机内存不足和运行时间长的问题,提升纠错性能.[方法]使用特定的数据对现有的基于K-spectrum的纠错算法进行测试,对各纠错工具的运行时间、内存峰值和纠错结果进行比较来衡量纠错工具的性能.在此基础上提出Hadoop分布式并行纠错算法(Parallel algorithm),并与串行程序、Lighter和Racer进行比较,分析分布式并行实现的可行性.[结果]现有的基于K-spectrum的纠错工具普遍存在较大的内存消耗现象,其中Racer和Sga的纠错效果较好.而Hadoop分布式并行纠错算法对计算机单机内存的消耗较低,当数据量超过一定值时,并行分布式程序的运算时间比串行单机程序明显减少.[结论]本研究提出的Hadoop分布式并行纠错算法不仅降低了内存消耗,而且提高了运算性能,更有利于大规模基因数据的分析处理.
推荐文章
下一代测序数据的质量控制研究
下一代测序
高通量测序
数据处理
质量控制
NRDPT:下一代测序数据的处理方法
下一代测序
基因测序
开源软件
图像处理
图像配准
图像分析
信号处理
面向下一代测序技术的结构变异检测算法综述
下一代测序技术
结构变异
拷贝数变异
生物二代测序数据的压缩算法研究进展
二代测序
压缩算法
生物信息学
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 基于K-spectrum的下一代测序数据的纠错算法分析
来源期刊 广西科学院学报 学科 工学
关键词 NGS 基因错误修正 Hadoop K-spectrum
年,卷(期) 2017,(1) 所属期刊栏目
研究方向 页码范围 7-11
页数 5页 分类号 TP301.6
字数 3233字 语种 中文
DOI 10.13657/j.cnki.gxkxyxb.20170228.001
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 梁家海 钦州学院电子与信息工程学院 33 73 5.0 6.0
2 陈庆锋 广西大学计算机与电子信息学院 8 2 1.0 1.0
6 黄丽宇 广西大学信息网络中心 4 20 2.0 4.0
7 赖德焕 广西大学计算机与电子信息学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (57)
共引文献  (1)
参考文献  (13)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
2001(1)
  • 参考文献(0)
  • 二级参考文献(1)
2003(1)
  • 参考文献(1)
  • 二级参考文献(0)
2004(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(2)
  • 参考文献(0)
  • 二级参考文献(2)
2009(10)
  • 参考文献(2)
  • 二级参考文献(8)
2010(9)
  • 参考文献(0)
  • 二级参考文献(9)
2011(14)
  • 参考文献(3)
  • 二级参考文献(11)
2012(7)
  • 参考文献(1)
  • 二级参考文献(6)
2013(12)
  • 参考文献(4)
  • 二级参考文献(8)
2014(10)
  • 参考文献(1)
  • 二级参考文献(9)
2015(1)
  • 参考文献(0)
  • 二级参考文献(1)
2016(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
NGS
基因错误修正
Hadoop
K-spectrum
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
广西科学院学报
季刊
1002-7378
45-1075/N
大16开
广西南宁市大岭路98号
1982
chi
出版文献量(篇)
1934
总下载数(次)
0
总被引数(次)
9503
论文1v1指导