コア・グループ・メンバーが開始すると、障害検出プロトコルを実行しているタスクも開始します。 このタスクは、メンバーがアクティブである限り実行されます。 障害検出プロトコルは、ディスカバリー・プロトコルが確立するコア・グループ・ネットワーク接続をモニターします。 障害検出プロトコルは、障害のあるネットワーク接続を検出すると、 View Synchrony Protocol とディスカバリー・プロトコルに障害を報告します。 View Synchrony Protocol は、失敗したメンバーを除外するようにビューを調整します。 ディスカバリー・プロトコルは、失敗したメンバーとのネットワーク接続を再確立しようとします。
コア・グループ・メンバーが管理コマンドに応答して正常に停止すると、 そのメンバーのコア・グループ・トランスポートも停止し、トランスポートに関連したソケットがクローズされます。 コア・グループ・メンバーが異常終了した場合は、通常、 基盤となるオペレーティング・システムがプロセスがオープンしたソケットをクローズし、 コア・グループ・トランスポートに関連したソケットをクローズします。
いずれのタイプの終了の場合も、 終了したメンバーへの接続がオープンされているコア・グループ・メンバーには、接続が使用できなくなったことが通知されます。 ソケットがクローズされたという通知を受けたコア・グループ・メンバーは、終了したメンバーを失敗したメンバ ーと見なします。
DCSV1113W: DCS Stack DefaultCoreGroup at Member anzioCell01¥anzioCellManager01¥dmgr: Suspected another member because the outgoing connection to the other member was closed. Suspected member is anzioCell01¥nettuno¥ServerB. DCS logical channel is View|Ptp. DCSV1111W: DCS Stack DefaultCoreGroup at Member anzioCell01¥anzioCellManager01¥dmgr: Suspected another member because the outgoing connection from the other member was closed. Suspected members is anzioCell01¥nettuno¥ServerB. DCS logical channel is Connected|Ptp.
クローズされたソケット・メカニズムは、 失敗したメンバーを発見する一般的な方法です。 基盤となるオペレーティング・システムの TCP 設定 (FIN_WAIT など) は、 ソケットのクローズ・イベントの受信速度に影響を与えます。
DCSV1112W: DCS Stack DefaultCoreGroup at Member anzioCell01¥anzioCellManager01¥dmgr: Suspected member anzioCell01¥nettuno¥ServerB because of heartbeat timeout. Configured Timeout is 180000 milliseconds. DCS logical channel is Connected|Ptp.