皆様お疲れ様です。
今月はシステムトラブルを未然に防止、軽減する取り組みについて投稿したいと思います。
システムトラブルが発生する原因としては主に下記となります。
①ハードウエア故障、ソフトウェアのバグによるトラブル
②ユーザの作業ミスによるトラブル
このうち②についてはユーザ側の作業となるため①の対策について記載します。
対策1;ハードウェアの健全性チェックを実施する
各ハードウェア(サーバ、ネットワーク、ストレージ)で故障が発生していないか、または故障の予兆となる事象が発生していないかをチェックします。
ベンダーにてそのようなサービスを実施していることが多いため、まずは各ハードウェアのベンダーに健全性チェックサービスがあるかを確認し
サービスが存在する場合は、お客様へ健全性チェックの提案するとよいでしょう。
対策2;ハードウェア、ソフトウェアの不具合情報を確認する
ハードウェア、ソフトウェアの不具合を定期的に確認しお客様へ報告します。
不具合情報はベンダーのサイトにまとめられていることが多いので、定期的に情報を確認しお客様へ報告するとよいでしょう
また、対策(パッチ、ファームウェアアップデート)についてもお客様へ相談するとよいですね。