Wenn der Job-Scheduler und der Grid-Endpunkt einen Grid-Stapeljob verarbeiten, wird der Jobstatus in der Datenbank des Job-Schedulers aktualisiert. Die folgende Abbildung zeigt die Beziehungen zwischen den einzelnen Status, und in der Tabelle unterhalb der Abbildung sind die möglichen Status von Stapeljobs sowie die Ergebnisse aufgelistet, die einen Statusübergang bewirken. Sie können den aktuellen Status eines Stapeljobs über die Jobverwaltungskonsole anzeigen oder über die Befehlszeile oder die EJB-Schnittstelle abrufen. Wenn vor der Initialisierung eines Stapelabschnitts ein Fehler auftritt, wechselt der Stapeljob in den Status für fehlgeschlagene Ausführung. Andernfalls wechselt er in einen wiederanlauffähigen Status.
Anfangsstatus | Clientbefehl | Systemaktion | Sonderbedingung | Numerische Rückkehrcodes | Endestatus |
---|---|---|---|---|---|
non-existent (delayed submit) | Übergeben | Nicht zutreffend | Nicht zutreffend | pending submit | |
non-existent | Übergeben | Nicht zutreffend | Nicht zutreffend | submitted | |
submitted | Nicht zutreffend | Zuteilen | Nicht zutreffend | 0 | executing |
submitted | Abbrechen | Nicht zutreffend | Nicht zutreffend | 0 | restartable |
executing | Abbrechen | Nicht zutreffend | Nicht zutreffend | 4 | cancel_pending |
executing | Nicht zutreffend | Anwendungsfehler abgefangen* | Nicht zutreffend | 4 | restartable |
executing | Nicht zutreffend | Nicht zutreffend | Fehler in der Infrastruktur** | 4 | restartable |
executing | Aussetzen | Nicht zutreffend | Nicht zutreffend | 4 | suspend_pending |
executing | Nicht zutreffend | Job abgeschlossen | Nicht zutreffend | 4 | ended |
executing | Nicht zutreffend | Nicht zutreffend | Problem der Infrastruktur im Jobabschnitt*** | 4 | execution_failed |
suspend_pending | Nicht zutreffend | Prüfpunkt | Nicht zutreffend | 2 | suspended |
suspend_pending | Nicht zutreffend | Nicht zutreffend | Fehler in der Infrastruktur** | 2 | restartable |
suspended | Wieder aufnehmen | Nicht zutreffend | Nicht zutreffend | 5 | resume_pending |
suspended | Abbrechen | Nicht zutreffend | Nicht zutreffend | 5 | cancel_pending |
suspended | Nicht zutreffend | Nicht zutreffend | Fehler in der Infrastruktur** | 5 | restartable |
resume_pending | Nicht zutreffend | Job wieder aufnehmen | Nicht zutreffend | 2 | executing |
resume_pending | Nicht zutreffend | Nicht zutreffend | Fehler in der Infrastruktur** | 2 | restartable |
restartable | Erneut starten | Nicht zutreffend | Nicht zutreffend | 8 | submitted |
cancel_pending | Nicht zutreffend | Job abgebrochen | Nicht zutreffend | 1 | restartable |
cancel_pending | Nicht zutreffend | Nicht zutreffend | Fehler in der Infrastruktur** | 1 | restartable |
restartable | Löschen | Nicht zutreffend | Nicht zutreffend | 8 | non-existent |
execution_failed | Löschen | Nicht zutreffend | Nicht zutreffend | 9 | non-existent |
ended | Löschen | Nicht zutreffend | Nicht zutreffend | 7 | non-existent |
* Anwendungsfehler |
Die Stapelanwendung ist zur Laufzeit fehlgeschlagen. Dieser Fehler wurde von den Compute-Grid-Endpunkten erkannt. |
**Fehler in der Infrastruktur |
Es ist ein unerwarteter Fehler aufgetreten. Schauen Sie sich das folgende Beispiel eine Infrastrukturproblems beim Jobaufbau an. |
*** Infrastrukturproblem beim Jobaufbau |
Ein unerwarteter Fehler, der auftritt, wenn ein Stapeljob zum ersten Mal von den Compute-Grid-Endpunkten vorbereitet wird. Wenn beispielsweise ein unerwarteter Datenbankfehler auftritt, wird der Job in den Status "execution_failed" versetzt. Beachten Sie, dass dieser Fall nur gilt, wenn der Stapeljob zum ersten Mal ausgeführt wurde und noch keine Abschnitte abgearbeitet wurden. Stapeljobs wechseln bei den meisten Fehlern in einen wieder anlauffähigen Status. In diesem Status können die Jobs an Prüfpunktpositionen wieder aufgenommen werden, sofern der Fehler behoben werden kann. Dies ist jedoch ein Fehler, bei dem ein Stapeljob in den Status "execution_failed" wechselt. In diesem Status kann der Job nicht wieder aufgenommen werden. Da sich dieses Szenario auf die Jobvorbereitung bezieht, in der der Stapeljob noch keine Aktivitäten aufgenommen hat, gehen keine Verarbeitungsschritte wegen des Fehlers verloren. |