Cluster Complex com Checkpoint/Restart

O cluster Complex agora usa o Berkeley Lab Checkpoint/Restart (BLCR). A idéia é a seguinte: você submete o programa, faz checkpoint periódicos (de duas em duas horas, por exemplo) e se acaso o programa for abortado, você pode resubmetê-lo a partir do último checkpoint, na mesma máquina ou em outra com configuração semelhante (que é o caso do cluster). Veja como submeter seus programas em Como rodar programas no cluster Complex. Existe um espaço para perguntas, deixe sua dúvida lá pois a resposta pode servir a outros usuários.