仮想ネットワークの障害管理(Hyper-V)

内容
casp1032jp
内容
障害分離の目的は、ネットワークの問題の根本原因を絞り込むことです。根本原因を見つけると、トラブルシューティングを実行して、迅速にその問題を修正したり、自動スクリプトを使って問題をプログラム的に修正したりすることができます。単一のデバイスに関する問題がネットワーク内の複数のデバイスにイベントを生成させる可能性があるため、どのデバイスがアラームの根本原因かを決定することは難しい可能性があります。
たとえば、Hyper-V ホストとの接続が切断されることは、多くの場合、管理する Hyper-V 仮想マシンとの接続も切断されることを意味します。そのため、Hyper-V ホスト デバイス モデルおよびすべての影響を受ける仮想マシンは、アラームを生成します。Virtual Host Manager は単一の根本原因を識別するため、障害分離テクニックを使用して、これらのアラームを相互に関連付けます。
仮想ネットワークは
CA Spectrum
 に代替管理という視点を提供するため、仮想ネットワークを独自に管理することができます。すなわち
CA Spectrum
 は、仮想デバイスとの直接接続、または仮想ネットワーク管理技術である Microsoft Hyper-V を介して、情報を収集できます。この代替管理視点は 2 つの方法で標準
CA Spectrum
障害管理を強化します。
  • 強化された接続切断アラーム
    -- デバイスに関する情報源が 2 つあるということは、Virtual Host Manager が原因を特定し、より簡単にイベントを単一の根本原因に相互に関連付けられることを意味します。
  • プロキシ障害アラーム
    --
    プロキシ管理
    は、プライマリ マネージャの代わりの、または追加の代替管理ソースを使用して、ネットワーク デバイスを管理する行為です。たとえば、
    CA Spectrum
     は、直接接続するか、仮想技術アプリケーションのデバイスとの接続を介して、仮想ネットワーク デバイスを管理できます。Hyper-V 仮想化技術が仮想ネットワーク デバイスとの接続が切断された場合、Virtual Host Manager は各デバイスに「プロキシの管理ロス」アラームの 1 つを生成します。これらは、デバイスの状態または直接(SNMP)
    管理
    の状態ではなく、
    プロキシ
    によるデバイスの管理に影響があることを警告するという点で独特のアラームです。
デバイスの接続が切断された場合の障害分離の仕組み
デバイスに関するネットワークの問題をトラブルシュートできるように、
CA Spectrum
 は障害分離を使用して、アラームの根本原因を絞り込みます。仮想ネットワークの場合、Virtual Host Manager は、デバイスと直接接続して取得した情報、および Hyper-V AIM による Hyper-V 仮想化技術によって提供された情報を使用します。多くの場合、標準
CA Spectrum
 障害管理は根本原因を正確に特定することができます。ただし、特殊な状況では、仮想ネットワークの問題を分離する方法は、標準的な方法の範囲を越えます。
Virtual Host Manager が根本原因を検出するために使用する障害分離のタイプは、どのデバイスがアラームを出しているか、およびデバイスが生成するイベントのタイプによって異なります。以下のシナリオでは、2 つの固有の障害管理状況、および
CA Spectrum
 が仮想ネットワークにおけるネットワークのエラーをどのように分離するかを説明します。
シナリオ 1: Hyper-V 仮想マシンが実行されていない
仮想環境では、仮想管理アプリケーションは
CA Spectrum
 が標準的なデバイス監視を介して検出するよりも詳しい詳細を提供できます。たとえば、Hyper-V 仮想マシンが「実行中」状態から「実行されていません」などの他の状態に変更されると、Hyper-V 仮想化技術によって認識されます。
Hyper-V 仮想マシンが実行中ではなくなり、
CA Spectrum
 がその接続を失うが、Hyper-V マネージャのプロキシ管理が中断されない場合、
CA Spectrum
は以下のように根本原因を特定します。
  1. CA Spectrum
     が Hyper-V 仮想マシンとの接続を失った場合、接続切断アラームを生成します。
  2. 次のポーリング サイクル中に、Hyper-V マネージャ モデルは仮想マシンに関する情報を収集するために Hyper-V AIM をポーリングします。Hyper-V 技術が仮想マシンを管理するため、Hyper-V 仮想マシンによって生成されたアラームの考えられる原因に、固有のビューを提供できます。
  3. Hyper-V 仮想化技術が仮想マシンが未実行モードであると認識した場合、Virtual Machine Not Running アラームを生成します。
    注:
    仮想マシンが再度実行中になると、このアラームは最初の Hyper-V AIM ポーリング サイクルでクリアされます。
  4. Virtual Host Manager は、
    CA Spectrum
     によって作成された、対応する Virtual Machine Not Running アラームに接続切断アラームを関連付けます。Virtual Host Manager は Virtual Machine Not Running アラームの兆候として、接続切断アラームを表示します。
シナリオ 2: Hyper-V ホストがダウンしている
CA Spectrum
 がモデリングされた Hyper-V マネージャとそのホストで実行されているすべての Hyper-V 仮想マシンとの接続を失った場合、
CA Spectrum
はアップストリームのルータとスイッチのステータスを確認します。これらのステータスに応じて、
CA Spectrum
 は以下のように根本原因を特定します。
  • 1 つ以上の仮想マシンまたは Hyper-V マネージャ用のアップストリームのデバイスがすべて使用できない -- 標準の
    CA Spectrum
     障害分離技術は以下のように根本原因を特定します。
    • ポーリングに対するデバイスの応答停止アラーム -- 任意の仮想マシンまたは Hyper-V マネージャ用に少なくとも 1 つのアップストリームの接続デバイスが稼働中の場合、Hyper-V ホストで生成されます。
    • ゲートウェイ到達不可能アラーム -- アップストリームの接続デバイスが
      すべて
      ダウンしている場合、Hyper-V ホストで生成されます。
  • 少なくとも 1 つのアップストリームのデバイスが、すべての仮想マシンおよび Hyper-V ホストに接続された Hyper-V マネージャ モデルに対して使用できる --
    CA Spectrum
     は、Hyper-V ホストが根本原因であり、以下のように応答すると示します。
    1. Hyper-V マネージャ モデルとすべての Hyper-V 仮想マシン、ポート、および Hyper-V マネージャ モデルまたは仮想マシン モデルに直接接続された FanOut は、標準の障害分離アラームを生成します。
    2. Virtual Host Manager は、Hyper-V ホスト モデルに対して物理ホスト ダウン アラームを作成します。
    3. 影響を受けるデバイス(仮想マシン、ポートおよび FanOut など)に対して生成される障害分離関連のアラームはすべて「物理ホスト ダウン」アラームに関連付けられているため、「物理ホスト ダウン」アラームの兆候となります。これらの兆候アラームは、「物理ホスト ダウン」アラームの[影響度]タブの[兆候]テーブルに表示されます。
      注:
      各 Hyper-V ホスト モデルに対して、Virtual Host Manager は「仮想障害ドメイン」を作成します。このドメインには Hyper-V ホスト、Hyper-V マネージャ、および仮想マシンが含まれます。また、Hyper-V マネージャ モデルおよび仮想マシンに直接接続されたすべてのポートおよび FanOut も含まれます。Hyper-V ホストが物理ホスト ダウン アラームを生成した場合、ドメイン内の標準的な障害分離アラームはすべてそれに関連付けられます。これらのアラームを兆候として相関することは、Hyper-V ホスト上の物理ホスト ダウン アラームが根本原因であることを示します。
    4. 影響を受けるデバイスはすべて、「物理ホスト ダウン」アラームの[影響度]タブの[管理ロスの影響度]テーブルに一覧表示されます。
      注:
      抑制されたデバイスには、対応するアラームが[兆候]テーブルにありません。
Example of the Alarm Detail dialog showing a Physical Host Down alarm on the Hyper-V Host and the alarms on all managed virtual machines that are impacted
1 つ以上の仮想マシンまたは Hyper-V マネージャのアップストリームのデバイスがすべてダウンしている場合、
CA Spectrum
 は信頼できる状態ではなくなり、障害が Hyper-V ホストにある可能性があります。そのため、
CA Spectrum
 は Physical Host Down アラームをクリアし、標準
CA Spectrum
障害分離テクニックを適用します。