デバイスの接続が切断された場合の障害分離の仕組み

デバイスに関するネットワークの問題をトラブルシュートできるように、sp は障害分離を使用して、アラームの根本原因を絞り込みます。仮想ネットワークの場合、Virtual Host Manager はデバイスとの直接接続によって得られる情報に加え、vCenter Server AIM を介して vCenter によって提供される情報を使用します。多くの場合、標準 sp 障害管理は根本原因を正確に特定することができます。ただし、特殊な状況では、仮想ネットワークの問題を分離する方法は、標準的な方法の範囲を越えます。
casp1032jp
デバイスに関するネットワークの問題をトラブルシュートできるように、
CA Spectrum
 は障害分離を使用して、アラームの根本原因を絞り込みます。仮想ネットワークの場合、Virtual Host Manager はデバイスとの直接接続によって得られる情報に加え、vCenter Server AIM を介して vCenter によって提供される情報を使用します。多くの場合、標準
CA Spectrum
 障害管理は根本原因を正確に特定することができます。ただし、特殊な状況では、仮想ネットワークの問題を分離する方法は、標準的な方法の範囲を越えます。
Virtual Host Manager が根本原因を検出するために使用する障害分離のタイプは、どのデバイスがアラームを出しているか、およびデバイスが生成するイベントのタイプによって異なります。以下のシナリオでは、2 つの固有の障害管理状況、および
CA Spectrum
 が仮想ネットワークにおけるネットワークのエラーをどのように分離するかを説明します。
シナリオ 1: 仮想マシンの電源が落とされるか、一時停止されます
仮想環境では、仮想管理アプリケーションは
CA Spectrum
 が標準的なデバイス監視を介して検出するよりも詳しい詳細を提供できます。たとえば、管理アプリケーションは、仮想マシンが次のいずれかのモードに入るタイミングを認識します。
  • 電源が落とされる
  • 一時停止
仮想マシンがこれらのモードのいずれかであり、
CA Spectrum
 と仮想マシンとの接続が切断されたにもかかわらず、ESX ホストのプロキシ管理が中断されていない場合、
CA Spectrum
は以下のように根本原因を確定します。
  1. CA Spectrum
     が仮想マシンとの接続を失うと、接続切断アラームが生成されます。
  2. その次のポーリング サイクル中に、vCenter サーバ モデルは vCenter Server AIM にポーリングを実行し、仮想マシンに関する情報を集めます。vCenter が仮想マシンを管理するため、vCenter は、仮想マシンによって生成されたアラームの考えられる原因の一意のビューを提供できます。
  3. 仮想マシンの電源が落とされたか、仮想マシンが一時停止したことを vCenter が検出した場合、vCenter は適切なアラームを生成します。
    注:
    Powered Down アラームと Suspended アラームは、仮想マシンの電源が入った後の最初の vCenter ポーリング サイクルでクリアされます。
  4. Virtual Host Manager は、
    CA Spectrum
    によって作成された、対応する接続切断アラームにこれらの Powered Down アラームと Suspended アラームを関連付けます。Virtual Host Manager は Powered Down アラームまたは Suspend アラームの兆候として、接続切断アラームを表示します。
シナリオ 2: ESX ホストがダウンしています
CA Spectrum
 が、モデリングされた ESX サービス コンソールとそのホストで実行されているすべての仮想マシンとの接続を失った場合、
CA Spectrum
はアップストリームのルータとスイッチのステータスを確認します。これらのステータスに応じて、
CA Spectrum
 は以下のように根本原因を特定します。
  • 1 つ以上の仮想マシンまたは ESX サービス コンソールのアップストリーム デバイスがすべて使用できない -- 標準
    CA Spectrum
     障害分離テクニックにより、以下のように根本原因を確定します。
    • Device Stopped Responding to Polls アラーム -- 任意の仮想マシンまたは ESX サービス コンソールに対して少なくとも 1 台のアップストリーム接続デバイスが起動している場合、ESX ホスト上で生成されます。
    • Gateway Unreachable アラーム -- アップストリーム接続デバイスが
      すべて
      ダウンしている場合、ESX ホスト上で生成されます。
  • ESX ホストに接続されたすべての仮想マシンおよび ESX サービス コンソール モデルに対して、少なくとも 1 台のアップストリーム デバイスを使用できる --
    CA Spectrum
     は、ESX ホストが根本原因であると推定し、以下のように対応します。
    1. ESX サービス コンソール モデルと、ESX サービス コンソール モデルまたは仮想マシン モデルに直接接続されているすべての仮想マシン、ポート、FanOut が標準の障害分離アラームを生成します。
    2. Virtual Host Manager は、ESX ホスト モデルに対して Physical Host Down アラームを生成します。
    3. 影響を受けるデバイス(仮想マシン、ESX サービス コンソール、ポート、FanOut など)に作成された障害分離関連のアラームはすべて物理ホスト ダウン アラームに相互に関連付けられ、物理ホスト ダウン アラームの兆候になります。これらの兆候アラームは、「物理ホスト ダウン」アラームの[影響度]タブの[兆候]テーブルに表示されます。
      注:
      各 ESX ホスト モデルに対して、Virtual Host Manager は「仮想障害ドメイン」を作成します。このドメインには ESX ホスト、ESX サービス コンソール、仮想マシンに加え、ESX サービス コンソール モデルまたは仮想マシンに直接接続されているすべてのポートと FanOut が含まれます。ESX ホストが[物理ホスト ダウン]アラームを生成した場合、ドメイン内の標準の障害分離アラームがすべてそれに関連付けられます。兆候としてこれらのアラームが相互に関連付けられたことは、ESX ホストの[物理ホスト ダウン]アラームが根本原因であることを示します。
    4. 影響を受けるデバイスはすべて、「物理ホスト ダウン」アラームの[影響度]タブの[管理ロスの影響度]テーブルに一覧表示されます。
      注:
      表示されていないデバイスは[兆候]テーブルに対応するアラームがありません。そのため、次の例では、影響を受けたデバイスが 6 つであるのに対し、アラームは 2 つだけになっています。
Example of the Alarm Detail dialog showing a Physical Host Down alarm on the ESX and the alarms on all managed virtual machines that are impacted
1 つ以上の仮想マシンまたは ESX サービス コンソールのアップストリーム デバイスがすべてダウンしている場合、
CA Spectrum
 は、障害の原因が ESX ホストにあることを確実に主張できません。そのため、
CA Spectrum
 は Physical Host Down アラームをクリアし、標準
CA Spectrum
障害分離テクニックを適用します。