皆様お疲れ様です。
先月はシステムトラブル対応方法について投稿しました。
今月は復旧方法について投稿したいと思います。
先月も書きましたがトラブル発生時は復旧優先で動きます。
その為復旧方法を早急に提示してあげる必要がありますが、
時間が限られている中できることはあまりなく決まっています。
それは、問題となる箇所を早急に特定(切り分け)して、問題を対処する、ということになります。
例えば、「○○サービスが動かない」といったトラブルの場合、そのサービスを提供しているサーバを特定してそのサービスを再起動する、またはそのサーバ自体を再起動するといった対処となります。
複数のサービスが動かない、といったケースもあります。
その場合、問題はサーバ側ではなく共通経路であるネットワーク側に問題がある可能性もあります。
その為ネットワーク側の状態を確認し、問題となる経路の閉塞や、ネットワーク機器の再起動といった対応が必要になるケースもあります。
いずれもケースバイケースで対応方法は変わってきますが、大まかにいうと上記のような対応になります。
ですので、早急に対応するには事前にお客様システムの構成やサービス、機器の調査方法、再起動方法を事前に準備しておくことが必要になります。
次回はそれら事前に準備しておくべきものに投稿したいと思います。