すべてのシステムのゴールは、故障時間をできる限り小さくすることです。しかし、 システム障害が避けらない場合もあります。 例えば、メイン・システムで予期しない停電が起こり、システム障害になることがあります。 システム障害が発生すると、行うことができる再始動アクションは、シスプレックス内のピア・システムでの再始動です。 このタイプの再始動では、ピアの再始動およびリカバリー 機能を使用します。 サーバーが構成されていないシステムでサーバーを始動すると、サーバーは暗黙的にピアの再始動およびリカバリー・モード に入ります。
メイン・システム障害が起こり、結果不明の未確定トランザク ションが発生した場合、このトランザクション結果を再度使用するには、 まずこれらの結果データを (できれば適切に) 取得する必要があります。 ピアの再始動およびリカバリーでは、ピア・システムでコントローラーを再始動することによって、 これを自動的に達成する方法が提供されています。これにより、データをブロックする「ロック」がドロップされ、 結果が決定できるようになります。これは、システムが自動的にロールバックして故障を処理する通常の方法とは対照的です。
WebSphere Application Server はリカバリー可能なリソース ・マネージャーではありません。 これは、リカバリー可能なコミュニケーション・マネージャー です。 独自のリカバリー可能なロックがなく、 ログでロックまたはロック状態を管理する必要がありません。 ただ、呼び出し元および呼び出し先が、分散トランザクションの通信セッションごとに、接続されていることを確認する 必要があります。
ピアの再始動およびリカバリーは、故障時に処理中のトランザクションに結果を割り当てるように、他のシステムでコントローラーを再始動し、トランザクション再始動およびリカバリー処理を完了します。 このトランザクション再始動およびリカバリー処理中に、データはリカバリー処理が完了するまで一時的にアクセス不能になることがあります。 再始動およびリカバリー処理によってデータが脱落することはありません。
故障時にアクセスしていたリソース・マネージャー (DB2 など) は、 トランザクション UR (リカバリー単位) を有効範囲とするロックを保持していることがあります。 結果が UR に割り当てられると、リソース・マネージャーは一般にこれらのロックをドロップします。