IBM PowerHA の状態監視

Cluster Manager は、環境内のさまざまなクラスタ コンポーネントの状態を監視し、以下のソースからのこの情報を取得します。
casp1032jp
Cluster Manager は、環境内のさまざまなクラスタ コンポーネントの状態を監視し、以下のソースからのこの情報を取得します。
  • 「CAhacmp-MIB」MIB のポーリング。クラスタ環境内のエレメントについて、100 を超えるオブジェクトが定期的に監視されます。この情報はポーリング サイクルに従って、
    CA Spectrum
     で更新されます。環境の健全性およびステータスに対する洞察力を提供する、さまざまなイベントおよびアラームを作成するには、Cluster Manager はこれらのオブジェクトから関連情報を引き出します。
  • 自己監視トラップ。インストールされたとき、HACMP AIM は管理対象のクラスタ コンポーネントのさまざまなリソースおよびアクティビティを追跡する、SystemEDGE エージェント上の自己監視を設定します。その監視はしきい値に基づきます。また、しきい値違反となった場合、aggregateState トラップが送信されます。その後、
    CA Spectrum
     はイベントを生成し、モニタの現在の重大度状態に応じて、適用可能なアラームを生成します。自己監視から収集されるデータには、ノード用の CPU またはメモリ使用率が含まれます。
クラスタ コンポーネントの状態を監視するために、Cluster Manager は両方の発生元からの情報を使用します。アラームが生成され、状態が修正されたとき、自動的にクリアされます。また、状態ベースのすべてのアラームも、ユーザによってクリア可能です。トラップおよびポーリングの発生元の両方で同じアクティビティが明らかになったとき、Cluster Manager はオーバーラップを識別します。ポーリングが生成するアラームが優先される、単一のアラームが作成されます。
リソース グループがプライマリ ノードからセカンダリ ノードに移るとき、アラームが発生します。リソース グループがセカンダリ ノードからプライマリに戻るとき、新しいアラームが最新の移行に対して生成されます。元のアラームは自動的にクリアされません。ただし、ユーザによってクリア可能です。
以下の表では、クラスタ コンポーネントごとの状態ベースのアラーム情報のリストを示します。
エンティティ
State
CA Spectrum
アラーム重大度
クラスタ
稼働
クリア
クラスタ
ダウン
[クリティカル](赤色)
クラスタ
不明
[メジャー](オレンジ色)
クラスタ
設定されていない
[クリティカル](赤色)
クラスタ
ネットワーク状態ダウン*
[メジャー](オレンジ色)
ノード
稼働
クリア
ノード
ダウン
[クリティカル](赤色)
ノード
統合
イベントのみ
ノード
移行中
イベントのみ
ノード
不明
[メジャー](オレンジ色)
ノード
高い CPU 使用率*
[メジャー](オレンジ色)
ノード
高いメモリ使用率*
[メジャー](オレンジ色)
ノード
ネットワーク インターフェース状態ダウン*
[メジャー](オレンジ色)
リソース グループ
不明
[メジャー](オレンジ色)
リソース グループ
オンライン
クリア
リソース グループ
オフライン
[クリティカル](赤色)
リソース グループ
取得中
イベントのみ
リソース グループ
開放中
イベントのみ
リソース グループ
エラー
[クリティカル](赤色)
リソース グループ
Onlinesec
クリア
リソース グループ
Acquiringsec
イベントのみ
リソース グループ
Releasingsec
イベントのみ
リソース グループ
Errorsec
[クリティカル](赤色)
リソース グループ
Offline_due_to_failover
[マイナー](黄色)
リソース グループ
Off_line_due_to_parent_off
[クリティカル](赤色)
リソース グループ
Unmanagedsec
[マイナー](黄色)
リソース グループ
Offline_due_to_lack_of_node
[クリティカル](赤色)
リソース グループ
管理対象外
[マイナー](黄色)
リソース グループ
親変更
[メジャー](オレンジ色)
* 自己監視 aggregateStateTrap から生成されたアラーム。