Cluster Complex com Checkpoint/Restart

O cluster Complex agora usa o Berkeley Lab Checkpoint/Restart (BLCR). A idéia é a seguinte: você submete o programa, faz checkpoint periódicos (de duas em duas horas, por exemplo) e se acaso o programa for abortado, você pode resubmetê-lo a partir do último checkpoint, na mesma máquina ou em outra com configuração semelhante (que é o caso do cluster). Veja como submeter seus programas em Como rodar programas no cluster Complex. Existe um espaço para perguntas, deixe sua dúvida lá pois a resposta pode servir a outros usuários.

Discussão

Enter your comment
LOTTQ
 
novidades/cluster-complex-com-checkpoint/restart.txt · Última modificação: 2007/12/03 16:22 (edição externa)
CC Attribution-Share Alike 3.0 Unported
www.chimeric.de Valid CSS Driven by DokuWiki do yourself a favour and use a real browser - get firefox!! Recent changes RSS feed Valid XHTML 1.0