MSCS 状態監視
Cluster Manager は、環境内のさまざまなクラスタ コンポーネントの状態を監視し、以下のソースからのこの情報を取得します。
casp1032jp
Cluster Manager は、環境内のさまざまなクラスタ コンポーネントの状態を監視し、以下のソースからのこの情報を取得します。
- CAMSCS-MIB のポーリング。クラスタ環境内のエレメントについて、数百のオブジェクトが定期的に監視されます。この情報はポーリング サイクルに従って、CA Spectrumで更新されます。環境の健全性およびステータスに対する洞察力を提供する、さまざまなイベントおよびアラームを作成するには、Cluster Manager はこれらのオブジェクトから関連情報を引き出します。
- 自己監視トラップ。インストールされたとき、MSCS AIM は管理対象のクラスタ コンポーネントのさまざまなリソースおよびアクティビティを追跡する、SystemEDGE エージェント上の自己監視を設定します。その監視はしきい値に基づきます。また、しきい値違反となった場合、aggregateState トラップが送信されます。その後、CA Spectrumはイベントを生成し、モニタの現在の重大度状態に応じて、適用可能なアラームを生成します。自己監視から収集されるデータには、ノード用の CPU またはメモリ使用率が含まれます。
クラスタ コンポーネントの状態を監視するために、Cluster Manager は両方の発生元からの情報を使用します。アラームが生成され、状態が修正されたとき、自動的にクリアされます。また、状態ベースのすべてのアラームも、ユーザによってクリア可能です。トラップおよびポーリングの発生元の両方で同じアクティビティが明らかになったとき、Cluster Manager はオーバーラップを識別します。ポーリングが生成するアラームが優先される、単一のアラームが作成されます。
以下の詳細情報が適用されます。
- MSCS AIM はクラスタの状態を提供しません。状態はクラスタの仮想 IP アドレスに ping を実行することにより決定されます。
- リソース グループがプライマリ ノードからセカンダリ ノードに移るとき、アラームが発生します。リソース グループがセカンダリ ノードからプライマリに戻るとき、新しいアラームが最新の移行に対して生成されます。元のアラームは自動的にクリアされません。ただし、ユーザによってクリア可能です。
以下の表では、クラスタ コンポーネントごとの状態ベースのアラーム情報のリストを示します。
エンティティ | State | CA Spectrum アラーム重大度 |
クラスタ | 稼働 | クリア |
クラスタ | ダウン | [クリティカル](赤色) |
ノード | 稼働 | クリア |
ノード | ダウン | [クリティカル](赤色) |
ノード | 統合 | イベントのみ |
ノード | 一時停止 | イベントのみ |
ノード | 不明 | [メジャー](オレンジ色) |
ノード | 高い CPU 使用率* | [メジャー](オレンジ色) |
ノード | 高いメモリ使用率* | [メジャー](オレンジ色) |
リソース グループ | 不明 | [メジャー](オレンジ色) |
リソース グループ | オンライン | クリア |
リソース グループ | オフライン | [クリティカル](赤色) |
リソース グループ | Failed (失敗) | [クリティカル](赤色) |
リソース グループ | Partial_online | [マイナー](黄色) |
リソース グループ | 保留 | イベントのみ |
リソース グループ | 親変更 | [メジャー](オレンジ色) |
リソース | 不明 | [メジャー](オレンジ色) |
リソース | 継承 | イベントのみ |
リソース | 初期化中 | イベントのみ |
リソース | オンライン | クリア |
リソース | オフライン | [メジャー](オレンジ色) |
リソース | Failed (失敗) | 重大(メジャー) |
リソース | 保留 | イベントのみ |
リソース | Online_Pending | イベントのみ |
リソース | Offline_Pending | イベントのみ |
* 自己監視 aggregateStateTrap から生成されたアラーム。