一般社団法人 全国個人事業主支援協会

COLUMN コラム

皆様お疲れ様です。

今月はシステムトラブルの原因究明のための調査方法に関して投稿したいと思います。

トラブルの原因を特定するには、その原因がどこにあるのかを切り分けすることが必要です。

具体的には、
・業務アプリ側にあるのか?プロダクト側にあるのか?
・プロダクトはサーバか?ストレージか?ネットワークか?
・サーバ内のどのコンポーネントか?(BIOS、OS、ソフトウェア等)

等を一つ一つ切り分けて発生箇所を特定します。
かなり骨の折れる作業ですが原因を特定するには必要な作業となります。

例えばトラブル発生時にサーバでエラーメッセージが出ていた場合は、
そのメッセージが業務アプリのログか?OSのログか?ソフトウェアのログか?
を区別して発生箇所を絞り込んで行くことができます。

一方でログが出ないケースもあります。
例えばサービスの遅延や処理性能の低下等のトラブルはエラーログが出ないことが多く原因の特定は結構やっかいです。
このような場合はまずはOSのリソース状況を確認し、発生時にOSが高負荷状態になっていたかどうか調べます。
OSが高負荷状態になっていた場合はどのリソースが原因なのか(CPU?メモリ?ディスク?)
OSが高負荷状態になっていない場合は業務アプリやソフトウェア等別のコンポーネントを調べていきます。

このように根本原因を特定するのは大変なことですが少しずつ絞り込んで行くことが必要となります。

The following two tabs change content below.

RI

最新記事 by RI (全て見る)

この記事をシェアする

  • Twitterでシェア
  • Facebookでシェア
  • LINEでシェア