プロキシ管理が失われた場合の障害分離の仕組み(Huawei SingleCLOUD)
仮想ネットワークの作成に使われる Huawei SingleCLOUD GalaX は、sp に固有の管理機会を提供します。sp は標準方法を使用して仮想デバイスに直接接続できます。また、sp は Huawei SingleCLOUD GalaX と通信する Huawei SingleCLOUD デバイス パックを使用して、同時に CAMM から仮想デバイス情報を収集できます。この意味で、CAMM は「プロキシ(代理)」であり、このプロキシから sp は仮想デバイス情報を収集します。sp はデバイスとの直接の接続を失うと、アラームを生成します。同様に、CAMM が仮想デバイス(Huawei SingleCLOUD GalaX を介して)との接続を失うか、Virtual Host Manager が CAMM との接続を失うと、Virtual Host Manager はプロキシ管理アラームを生成します。
casp1032jp
仮想ネットワークの作成に使われる Huawei SingleCLOUD GalaX は、
CA Spectrum
に固有の管理機会を提供します。CA Spectrum
は標準方法を使用して仮想デバイスに直接接続できます。また、CA Spectrum
は Huawei SingleCLOUD GalaX と通信する Huawei SingleCLOUD デバイス パックを使用して、同時に CAMM から仮想デバイス情報を収集できます。この意味で、CAMM は「プロキシ(代理)」であり、このプロキシから CA Spectrum
は仮想デバイス情報を収集します。CA Spectrum
はデバイスとの直接の接続を失うと、アラームを生成します。同様に、CAMM が仮想デバイス(Huawei SingleCLOUD GalaX を介して)との接続を失うか、Virtual Host Manager が CAMM との接続を失うと、Virtual Host Manager はプロキシ管理アラームを生成します。これを受けて、
CA Spectrum
は、プロキシ管理障害の原因を特定しようとします。プロキシ障害分離は、標準的な CA Spectrum
障害分離に似ていますが、これらのアラートにより、仮想デバイスのプロキシ
管理が影響を受けているということが警告される点が異なっています。プロキシ管理の障害分離は、仮想デバイスが稼働中かダウンしているかを通知することはできません。ただし、デバイスに関する重要な仮想情報が失われる可能性があるため、プロキシを介した接続がいつ切断されたかを知ることが重要です。Virtual Host Manager が根本原因を検出するために使用するプロキシ障害分離のタイプは、どのデバイスがアラームを出しているか、およびデバイスが生成するイベントのタイプによって異なります。以下のシナリオでは、プロキシ障害管理状況、および Virtual Host Manager が仮想ネットワークにおけるネットワークのエラーをどのように分離するかを説明します。
シナリオ 1:
CA Spectrum
と CAMM (Huawei SingleCLOUD マネージャ)間の接続が切断されたCA Spectrum
が Huawei SingleCLOUD マネージャ モデルとの接続を失うか、Huawei SingleCLOUD マネージャ モデルのポーリングを停止すると、CA Spectrum
は、Huawei SingleCLOUD マネージャが管理するすべての仮想モデルに関する、更新済みの Huawei SingleCLOUD GalaX データを取得できません。問題を分離するために、Virtual Host Manager は以下のように根本原因を確定します。- CA Spectrumは、Huawei SingleCLOUD クラウド、ホスト、CNA FIP、仮想マシンなど、Huawei SingleCLOUD マネージャが管理するすべての仮想モデルに対してプロキシ ロスト アラームを生成します。CA Spectrumは、Huawei SingleCLOUD マネージャ モデルに対して Manager Unavailable アラームも別途生成します。
- Huawei SingleCLOUD アラームは、対応する Huawei SingleCLOUD ホスト モデル アラームに関連付けられます。
- Huawei SingleCLOUD およびホスト モデルのアラームは、Huawei SingleCLOUD マネージャ モデルの「プロキシ使用不可」アラームに関連付けられます。
- この「プロキシ使用不可」アラームはその後、ダウンしている Huawei SingleCLOUD マネージャの根本原因に関連付けられます。根本原因は通常、以下の状況で作成されたアラームなど、標準CA Spectrum障害管理によって生成されたアラームです。
- Huawei SingleCLOUD マネージャの管理のロス(すなわち、問題が CAMM で発生した)
- マシン接続が失われた
- Huawei SingleCLOUD マネージャ モデルが保守モードである
シナリオ 2: CAMM および Huawei SingleCLOUD GalaX 間の接続が切断された
特定の期間内に CAMM が更新されない場合、CAMM によってレポートされた Huawei SingleCLOUD プラットフォーム データは最新ではない可能性があります。ハートビート インジケータおよび設定されたポーリング レートを使用すると、
CA Spectrum
は、管理対象の Huawei SingleCLOUD エンティティが最後に更新されたのはいつか識別できます。Huawei SingleCLOUD ホストまたは仮想マシンが設定された期間内に更新されていない場合、Virtual Host Manager は Huawei SingleCLOUD GalaX との通信で CAMM は使用できないと判断します。「プロキシ接続切断」アラームが、Huawei SingleCLOUD ホスト、CNA FIP、およびこの Huawei SingleCLOUD マネージャによって管理された仮想マシン上で生成されます。複数のエレメントが更新されていない場合、
CA Spectrum
は、これらのアラームを適切な根本原因(ホストに関連付けられている複数の仮想マシン アラームなど)に関連付けます。さらに、CAMM プレゼンタと関連付けられた仮想 IP のいずれとも接続できない場合、Huawei SingleCLOUD CAMM Presenter モデル上で「物理ホスト ダウン」アラームが生成されます。アラーム テキストには、障害が発生した CAMM を特定する情報と、最後に通信が成功した時刻が提供されます。シナリオ 3: Huawei SingleCLOUD GalaX と Huawei SingleCLOUD ホスト間の接続が切断された
Huawei SingleCLOUD GalaX が、管理対象の Huawei SingleCLOUD ホストの 1 つと接続を失うと、ホストおよびすべてのホストされた仮想デバイスに関するプロキシ データが失われます。問題を分離するために、Virtual Host Manager は以下のように根本原因を確定します。
- 「プロキシ接続切断」アラームが、Huawei SingleCLOUD ホスト、CNA FIP、およびホストされたすべての仮想マシン上で生成されます。
- CNA FIP および仮想マシンアラームは、Huawei SingleCLOUD ホストの「プロキシ接続切断」アラームに関連付けられるため、これらのアラームは、Huawei SingleCLOUD ホスト アラームの兆候になります。これらのアラームを兆候として関連付けることは、Huawei SingleCLOUD ホスト アラームが根本原因であることを意味します。
- またCA Spectrumが Huawei SingleCLOUD ホストとの接続を失い、Physical Host Down アラームが生成された場合、Huawei SingleCLOUD ホストに対して生成されたプロキシ ロスト アラームは、Physical Host Down アラームに関連付けられます。この場合、「プロキシ接続切断」アラームは、「物理ホスト ダウン」アラームの兆候になります。このアラームが兆候として関連付けられると、Huawei SingleCLOUD ホスト上の「物理ホスト ダウン」アラームが根本原因であることを示します。