デバイスの接続が切断された場合の障害分離の仕組み(Huawei SingleCLOUD)

デバイスに関するネットワークの問題をトラブルシュートできるように、sp は障害分離を使用して、アラームの根本原因を絞り込みます。仮想ネットワークの場合、Virtual Host Manager はデバイスとの直接接続によって得られる情報に加え、CAMM を介して Huawei SingleCLOUD GalaX によって提供される情報を使用します。多くの場合、標準 sp 障害管理は根本原因を正確に特定することができます。ただし、特殊な状況では、仮想ネットワークの問題を分離する方法は、標準的な方法の範囲を越えます。
casp1032jp
デバイスに関するネットワークの問題をトラブルシュートできるように、
CA Spectrum
 は障害分離を使用して、アラームの根本原因を絞り込みます。仮想ネットワークの場合、Virtual Host Manager はデバイスとの直接接続によって得られる情報に加え、CAMM を介して Huawei SingleCLOUD GalaX によって提供される情報を使用します。多くの場合、標準
CA Spectrum
 障害管理は根本原因を正確に特定することができます。ただし、特殊な状況では、仮想ネットワークの問題を分離する方法は、標準的な方法の範囲を越えます。
Virtual Host Manager が根本原因を検出するために使用する障害分離のタイプは、どのデバイスがアラームを出しているか、およびデバイスが生成するイベントのタイプによって異なります。以下のシナリオでは、障害管理状況、および
CA Spectrum
 が仮想ネットワークにおけるネットワークのエラーをどのように分離するかを説明します。
シナリオ 1: Huawei SingleCLOUD 仮想マシンが実行されていない
仮想環境では、仮想管理アプリケーションは
CA Spectrum
 が標準的なデバイス監視を介して検出するよりも詳しい詳細を提供できます。たとえば、Huawei SingleCLOUD GalaX は、仮想マシンが実行状態から別の状態にいつ移行するかを認識します。
仮想マシンが実行中の状態でなくなり、
CA Spectrum
 と仮想マシンとの接続が切断されたにもかかわらず、仮想マシンのプロキシ管理が中断されていない場合、
CA Spectrum
は以下のように根本原因を確定します。
  1. CA Spectrum
     が仮想マシンとの接続を失うと、接続切断アラームが生成されます。
  2. その次のポーリング サイクル中に、Huawei SingleCLOUD マネージャ モデルは、仮想マシンに関する情報を収集するために、Huawei SingleCLOUD GalaX と通信する CAMM をポーリングします。Huawei SingleCLOUD GalaX が仮想マシンを管理するので、仮想マシンによって生成されたアラームの考えられる原因に関する一意のビューが提供できます。
  3. 仮想マシンが非実行モードであることを Huawei SingleCLOUD GalaX が示している場合、Huawei SingleCLOUD Not Running アラームが生成されます。
    注:
    このアラームはポーリング サイクル中にクリアされ、その後、CAMM は仮想マシンが再実行されているかどうかを決定します。
  4. Virtual Host Manager は、
    CA Spectrum
     によって生成された、対応する Huawei SingleCLOUD Not Running アラームに接続切断アラームを関連付けます。Virtual Host Manager は Huawei SingleCLOUD Not Running アラームの兆候として、接続切断アラームを表示します。
シナリオ 2: Huawei SingleCLOUD ホストがダウンしている
CA Spectrum
 が Huawei SingleCLOUD ホスト上で実行されているすべての仮想マシンとの接続を失うと、
CA Spectrum
はアップストリームのルータおよびスイッチのステータスを確認します。これらのステータスに応じて、
CA Spectrum
 は以下のように根本原因を特定します。
  • 1 つ以上の Huawei SingleCLOUD 仮想マシンのアップストリームのデバイスがすべて使用不可能な場合
    根本原因を確定するために、標準
    CA Spectrum
     障害分離テクニックが使用されます。
    • アップストリーム接続デバイスが
      すべて
      ダウンしている場合、Huawei SingleCLOUD ホスト上で Gateway Unreachable アラームが生成されます。
  • Huawei SingleCLOUD ホストに接続されている仮想マシンごとに、少なくとも 1 つのアップストリームのデバイスが使用可能な場合
    CA Spectrum
     は、Huawei SingleCLOUD ホストが根本原因であると推定し、以下のように対応します。
    1. Huawei SingleCLOUD ホスト モデルに直接接続されるすべての Huawei SingleCLOUD 仮想マシン、ポートおよび FanOut は、標準的な障害分離アラームを生成します。
    2. Virtual Host Manager は、Huawei SingleCLOUD ホスト モデルに対して Physical Host Down アラームを生成します。
    3. 影響を受けるデバイス(仮想マシン、ポートおよび FanOut など)に対して生成される障害分離関連のアラームはすべて「物理ホスト ダウン」アラームに関連付けられているため、「物理ホスト ダウン」アラームの兆候となります。これらの兆候アラームは、「物理ホスト ダウン」アラームの[影響度]タブの[兆候]テーブルに表示されます。
      注:
       Virtual Host Manager は Huawei SingleCLOUD ホスト モデルごとに「仮想障害ドメイン」を作成します。このドメインには Huawei SingleCLOUD ホスト、CNA FIP、および仮想マシンと、Huawei SingleCLOUD ホストに直接接続されているすべてのポートと FanOut が含まれます。Huawei SingleCLOUD ホストが「物理ホスト ダウン」アラームを生成すると、ドメイン内の標準的な障害分離アラームはすべてそのアラームに関連付けられます。これらのアラームが兆候として関連付けられると、Huawei SingleCLOUD ホスト上の「物理ホスト ダウン」アラームが根本原因であることを示します。
    4. 影響を受けるデバイスはすべて、「物理ホスト ダウン」アラームの[影響度]タブの[管理ロスの影響度]テーブルに一覧表示されます。
      注:
      抑制されたデバイスには、対応するアラームが[兆候]テーブルにありません。
      アラーム情報に関する[影響度]タブの使用の詳細については、「ホスト停止によって影響を受ける仮想マシンの特定」を参照してください。
    5. 1 つまたは複数の仮想マシンのすべてのアップストリーム デバイスがダウンしている場合、
      CA Spectrum
      は、障害の原因が Huawei SingleCLOUD ホストにあることを確実に主張できません。
      CA Spectrum
       は、Physical Host Down アラームをクリアし、標準
      CA Spectrum
      障害分離テクニックを適用します。