Cluster Manager のアラームと障害管理

リソース グループ マイグレーションまたはクラスタ ノード失敗など、特定のアクティビティについて知っていると、クラスタ環境の潜在的な問題を最小化できます。ユーザにアラートするには、sp でアラームを生成し、高度な障害管理技術を使用して根本原因を分離します。
casp1032jp
リソース グループ マイグレーションまたはクラスタ ノード失敗など、特定のアクティビティについて知っていると、クラスタ環境の潜在的な問題を最小化できます。ユーザにアラートするには、
CA Spectrum
でアラームを生成し、高度な障害管理技術を使用して根本原因を分離します。
単一のデバイスに関する問題では、ネットワーク内の他のいくつかのデバイスでイベントが生成される場合があります。どのデバイスがアラームの根本原因かを特定することは難しい場合があります。たとえば、Cluster Manager (プロキシ マネージャ)との接続を失うと、それが管理するクラスタ ノードとのプロキシ通信も失います。その結果、Cluster Manager およびその管理対象コンポーネントのそれぞれに対してアラームが生成されます。同時に生成された数百のアラームを手動で選別し、問題を特定することは、面倒で、エラーが発生しやすいプロセスとなる場合があります。Cluster Manager は、障害分離技術を使用して、単一の根本原因を特定するために自動的にこれらのアラームを相関させることにより、トラブルシューティング プロセスを著しく簡略化します。その結果、その問題をより迅速に識別し、修正できます。
アラームと障害分離は、クラスタ技術によって異なります。Cluster Manager は、どのデバイスがアラーム、およびデバイスが生成するイベントのタイプを発生させているかを評価します。
CA Spectrum
は利用可能な情報をすべて使用して、アラームを適切な根本原因に相関させ、分離された障害の発生したデバイス上でアラームを発行します。Cluster Manager は、意味のあるイベントおよびアラームを作成するために標準的な
CA Spectrum
監視、プロキシ管理、状態ポーリング、およびトラップの組み合わせを使用します。
注:
標準装備のものに加えて、他の特定のメトリックのイベントおよびアラームを生成するために独自のカスタム ウォッチを作成できます。ウォッチを作成する詳細については、「ウォッチ」セクションを参照してください。