基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
宏基因组基因聚类是筛选致病基因的新型方法,其依赖于海量的测序数据、有效的聚类算法以及高效的计算机来实现.相关系数矩阵的计算是进行聚类前必须完成的操作,占总计算量的比重较大.以某基因库为例,包含1300个样本、每样本百万基因的数据,单线程运行需要27年.充分发挥多核CPU的潜力,利用GPU加速卡强大的计算能力,将程序扩展到多节点集群上运行,是重要而迫切的工作.在仔细分析算法的基础上,首先针对单CPU节点和单GPU卡做了高效实现,获得了接近理想的加速比;然后利用缓存优化进一步提升性能;最后使用负载均衡方法在MPI线程间分发计算任务,实现了良好的扩展.相比未优化的单线程程序,16节点CPU获得了238.8倍的加速,6块GPU卡获得了263.8倍的加速.
推荐文章
宏基因组技术在耐药细菌研究中的应用
宏基因组技术
耐药细菌
非培养微生物
抗耐药菌抗菌药物
温泉土壤宏基因组文库构建及普鲁兰酶筛选
普鲁兰酶
宏基因组
16S rRNA
DNA文库
温泉土壤
宏基因组技术在开发未培养环境微生物基因资源中的应用
宏基因组
未培养微生物
核酸提取
宏基因组文库构建
宏基因组文库筛选
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 异构集群上的宏基因组聚类优化
来源期刊 计算机科学 学科 工学
关键词 基因聚类 异构计算 缓存优化 负载均衡
年,卷(期) 2017,(3) 所属期刊栏目 2015全国高性能计算学术年会
研究方向 页码范围 20-22,47
页数 4页 分类号 TP391
字数 3056字 语种 中文
DOI 10.11896/j.issn.1002-137X.2017.03.005
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 林新华 上海交通大学高性能计算中心 29 59 5.0 6.0
3 韦建文 上海交通大学高性能计算中心 13 41 3.0 6.0
4 许志耿 上海交通大学高性能计算中心 1 0 0.0 0.0
5 王丙强 1 0 0.0 0.0
6 Simon SEE 上海交通大学高性能计算中心 1 0 0.0 0.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (0)
共引文献  (0)
参考文献  (4)
节点文献
引证文献  (0)
同被引文献  (0)
二级引证文献  (0)
2011(1)
  • 参考文献(1)
  • 二级参考文献(0)
2012(2)
  • 参考文献(2)
  • 二级参考文献(0)
2014(1)
  • 参考文献(1)
  • 二级参考文献(0)
2017(0)
  • 参考文献(0)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
研究主题发展历程
节点文献
基因聚类
异构计算
缓存优化
负载均衡
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机科学
月刊
1002-137X
50-1075/TP
大16开
重庆市渝北区洪湖西路18号
78-68
1974
chi
出版文献量(篇)
18527
总下载数(次)
68
论文1v1指导