基本信息来源于合作网站,原文需代理用户跳转至来源网站获取       
摘要:
大型科学与工程计算需要实现空前复杂的数值模拟计算和处理空前庞大的数据,有必要设计一个容错环境,自动调度加载故障程序.基于并行作业和系统提供的checkpoint/restart功能,本文设计了一个用户级的并行作业容错自动调度环境,包括并行程序容错调度的自动感知、自动加载和数据完整性保证算法.测试结果表明,并行作业容错自动调度环境保证了checkpoint数据的完整性,并在应用程序出错退出以后,调度环境可以自动感知,自动提交运行作业,实现了并行作业无需用户干预的容错自动调度计算,避免了系统资源和计算时间的浪费.
推荐文章
基于BACKFILL的"削足适履"并行作业调度算法
算法
系统分析
并行计算
作业调度
回填算法
矩阵LU分解的容错并行算法设计与实现
矩阵LU分解
并行算法
容错
并行离散事件模拟系统容错功能设计
并行离散事件模拟
Time Warp
分布式逻辑进程模拟结构
容错
内容分析
关键词云
关键词热度
相关文献总数  
(/次)
(/年)
文献信息
篇名 并行作业容错自动调度环境设计
来源期刊 计算机工程与科学 学科 工学
关键词 高性能计算 容错 checkpoint/restart 并行程序
年,卷(期) 2009,(11) 所属期刊栏目 并行算法与并行程序设计
研究方向 页码范围 87-90
页数 4页 分类号 TP302.8
字数 5191字 语种 中文
DOI 10.3969/j.issn.1007-130X.2009.11.023
五维指标
作者信息
序号 姓名 单位 发文数 被引次数 H指数 G指数
1 蒋杰 国防科技大学计算机学院 30 280 9.0 16.0
2 迟利华 国防科技大学计算机学院 12 64 4.0 7.0
3 刘杰 国防科技大学计算机学院 24 95 5.0 9.0
4 胡庆丰 国防科技大学计算机学院 18 97 6.0 9.0
5 徐涵 国防科技大学计算机学院 17 98 5.0 9.0
6 张亦添 国防科技大学计算机学院 1 1 1.0 1.0
传播情况
(/次)
(/年)
引文网络
引文网络
二级参考文献  (7)
共引文献  (2)
参考文献  (3)
节点文献
引证文献  (1)
同被引文献  (0)
二级引证文献  (0)
1985(2)
  • 参考文献(0)
  • 二级参考文献(2)
1994(1)
  • 参考文献(0)
  • 二级参考文献(1)
1997(1)
  • 参考文献(0)
  • 二级参考文献(1)
1998(2)
  • 参考文献(1)
  • 二级参考文献(1)
2002(1)
  • 参考文献(0)
  • 二级参考文献(1)
2006(1)
  • 参考文献(0)
  • 二级参考文献(1)
2008(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
2009(1)
  • 参考文献(1)
  • 二级参考文献(0)
  • 引证文献(0)
  • 二级引证文献(0)
2013(1)
  • 引证文献(1)
  • 二级引证文献(0)
研究主题发展历程
节点文献
高性能计算
容错
checkpoint/restart
并行程序
研究起点
研究来源
研究分支
研究去脉
引文网络交叉学科
相关学者/机构
期刊影响力
计算机工程与科学
月刊
1007-130X
43-1258/TP
大16开
湖南省长沙市开福区德雅路109号国防科技大学计算机学院
42-153
1973
chi
出版文献量(篇)
8622
总下载数(次)
11
总被引数(次)
59030
相关基金
国家自然科学基金
英文译名:the National Natural Science Foundation of China
官方网址:http://www.nsfc.gov.cn/
项目类型:青年科学基金项目(面上项目)
学科类型:数理科学
国家高技术研究发展计划(863计划)
英文译名:The National High Technology Research and Development Program of China
官方网址:http://www.863.org.cn
项目类型:重点项目
学科类型:信息技术
  • 期刊分类
  • 期刊(年)
  • 期刊(期)
  • 期刊推荐
论文1v1指导