基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
随着第二代测序技术的发展与应用,其产生的测序数据也呈现快速的增长趋势,如何有效、快速、稳定地对海量测序数据进行分析成为生物研究领域迫切的需求.目前许多传统的测序数据分析软件仅支持单一功能,并不具备完整的数据分析能力,应对海量的测序数据时其处理能力也显著不足.为了应对上述问题,本文设计了一款基于Hadoop框架的测序数据分析软件,整合了现今生物研究领域内常用的多款序列分析软件,从而实现了对测序序列数据的自动化分析.该软件输入原始的测序数据后,经过碱基质量控制、序列比对、SNP位点信息提取、突变基因信息生成等几个过程,最终输出详细的突变基因信息报告.该软件实现了自动化的数据分析,提高了数据分析的效率,极大减轻了数据分析人员的工作量.
推荐文章
加密环境下大数据特征集并行存储方法研究
大数据特征集
并行存储
MMSE算法
Hash索引
结果分析
映射处理
虚拟环境下大数据智能并行聚类方法研究
虚拟环境
大数据
智能并行
聚类方法
信息系统在大数据环境下的应用分析
信息系统
大数据
数据管理
信息分析
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 组学大数据环境下的基因变异信息并行处理与分析
来源期刊 北京生物医学工程 学科 医学
关键词 第二代测序技术 Hadoop 序列数据分析 基因突变信息 单核苷酸多态性
年,卷(期) 2017,(4) 所属期刊栏目 论著
研究方向 页码范围 366-371,419
页数 7页 分类号 R318.04
字数 4274字 语种 中文
DOI 10.3969/j.issn.1002-3208.2017.04.007
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 王红强 中国科学院合肥智能机械研究所 12 90 7.0 9.0
2 黄芝准 中国科学院合肥智能机械研究所 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (24)
共引文献  (5)
参考文献  (11)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1977(1)
  • 参考文献(0)
  • 二级参考文献(1)
1999(1)
  • 参考文献(0)
  • 二级参考文献(1)
2005(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(3)
  • 参考文献(3)
  • 二级参考文献(0)
2010(3)
  • 参考文献(0)
  • 二级参考文献(3)
2011(2)
  • 参考文献(1)
  • 二级参考文献(1)
2012(5)
  • 参考文献(4)
  • 二级参考文献(1)
2013(5)
  • 参考文献(0)
  • 二级参考文献(5)
2014(4)
  • 参考文献(0)
  • 二级参考文献(4)
2015(6)
  • 参考文献(0)
  • 二级参考文献(6)
2016(3)
  • 参考文献(2)
  • 二级参考文献(1)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2018(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
第二代测序技术
Hadoop
序列数据分析
基因突变信息
单核苷酸多态性
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
北京生物医学工程
双月刊
1002-3208
11-2261/R
16开
北京安定门外安贞医院
1981
chi
出版文献量(篇)
2829
总下载数(次)
13
总被引数(次)
15960
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
安徽省自然科学基金
英文译名:Anhui Provincial Natural Science Foundation
官方网址:http://www.ahinfo.gov.cn/zrkxjj/index.htm
项目类型:安徽省优秀青年科技基金
学科类型:
论文1v1指导