一般社団法人 全国個人事業主支援協会

COLUMN コラム

  • 「ネットワーク監視」について

<ネットワーク監視とは>
ネットワーク監視とは、ネットワークダウンや性能低下によるレスポンス悪化など、
ルーターやスイッチ、サーバなどのネットワーク機器の稼働状況を監視することです。
多くの場合、専用のツールを活用し、監視は基本的に24時間365日体制で実施されているでしょう。

監視の仕組みは、まず監視対象となるサーバの稼働情報を収集する「エージェント」と
呼ばれるソフトウェアを、すべての監視対象にインストールします。

そして、ネットワーク機器やサーバ、通信トラフィックなどの障害や性能低下などが
発生したら、迅速に管理者に通知します。
ネットワーク管理者はその報告を受けることで、速やかに対応できるでしょう。

ただしスイッチなどのネットワーク機器には、エージェントをインストールできません。
この場合、サーバも含めエージェントを活用しないエージェントレス式のネットワーク
監視ツールを導入する必要があります。

<ネットワーク監視の監視項目>
ネットワーク監視は、主に以下の項目に分類できます。

・死活監視
・ハードウェアの状態監視
・サービス・プロトコル監視
・トラフィック監視
・TRAP監視
・API監視
・ログ監視

 

◆死活監視
死活監視とは、サーバやサーバ周辺のネットワーク機器の稼働状態が正常かどうかを
確認することです。
専用のシステムを活用してサーバへ通知を送り、応答があるか否かで異常発生を判断します。

具体的な死活監視には2種類あり、サーバからの応答速度を図り、異常がないかを
監視する「Ping」と呼ばれる監視方法と、Webサーバのポートにアクセスして異常が
ないかどうかを確認する「ポート監視」があります。

Ping監視とポート監視の併用により、Webサーバだけでなくプログラムやアプリケーション
の稼働状況まで細部にいたるまで確認が可能です。

 

◆ハードウェアの状態監視
監視対象機器のCPU使用率、メモリ使用率、ハードディスク使用率、プロセス数のような
リソースを監視します。
これらの使用率が高かったり負荷がかかったりしている場合、ネットワーク内の機器が
使用不可になるほか、安定したサービス提供が実施できません。

状態監視は、障害が発生する前に、異常を検知し原因を特定します。
異常個所が検出された場合、対象部分を切り離すことで被害を未然に防止します。

 

◆サービス・プロトコル監視
ネットワークでは、さまざまなプロトコルが使用されています。
例えば、HTTPはサーバとWebブラウザ間のやり取りに活用されたり、TCP・UDPなどはデータ
を転送したりする役割があるでしょう。

ネットワーク監視ではサービス・プロトコルの監視を行い、応答時間などが適切かを確認し、
正常なネットワーク稼働を維持します。
自動車でいえば、ブレーキやアクセル、ウインカーに異常がないかをチェックすることです。

 

◆トラフィック監視
自動車が正常でも、高速道路が渋滞で目的地に到着できないのと同様に、ネットワークでは
ハードやソフトが正常でも、トラフィックが混雑するとうまく接続ができません。
そこで、トラフィック監視が必要となります。

具体的には、サーバやネットワーク機器のトラフィック量を監視します。
これによりトラフィックが混雑する原因の究明や混雑する時間帯などを見極められるため、
設備増強などの対策が打ち出せるでしょう。

 

◆TRAP監視
ネットワーク機器には、障害や通信量の急増など監視している機器に異常が起きた場合、
監視されている機器から「TRAP」と呼ばれる通知を自動的に送る仕組みが用意されています。
この通知が発生するか否か確認に用いられるのが、TRAP監視です。

代表的なものに、ルータやスイッチングハブなどのネットワーク機器、Windows、UNIXといった
サーバの状態を監視するプロトコルである「SNMP」において、TRAP監視が用いられています。

 

◆API監視
多くの企業で、さまざまなクラウドサービスが導入されている現代では、呼び出したAPIが
スムーズに利用できることは、ユーザーの利便性において重要なポイントです。
API監視では、APIに接続されたリソースの稼働や応答状況、利用の可否などを確認します。

また、APIの可用性にエラーが生じた場合、問題個所を特定します。
さらに、自動でアラートを送信できる場合もあり、ダウンタイムを最小限に抑えられるでしょう。

 

◆ログ監視
ログ監視では、サーバやアプリケーション、ネットワーク機器などの
ログ(PCなどのアクセス記録)を監視します。

リアルタイムにログを収集することで、Webサービスの通信を可視化できます。
通信障害のログを解析すれば、原因究明に活用できるほか、障害の影響範囲やトラフィック
を把握可能です。

 

The following two tabs change content below.

久米 大輔

この記事をシェアする

  • Twitterでシェア
  • Facebookでシェア
  • LINEでシェア