2024/1~参画している某大手小売り業様の社内基盤保守案件対応中。
基本フルリモートでの作業であり、1月の出社は0回。
基盤保守業務全般の対応(実作業は配下のベンダーが実施するため、関係者間の調整やベンダー管理が主業務)。
今月実施したPacemakerのバージョンアップ作業時、2点想定外が発生。
1点目はバージョンアップ後のOS再起動ができなかったこと。
調査したところ、一部機能が再起動自動マウント設定されておらず、食い違いが発生したことが原因だった。
自動マウント設定を変更し、解決済み。
2点目は想定外のジョブエラーが発生したこと。
Act-Standby構成をとっているサーバであり、稼働系→待機系の切り替えに伴い5分程度ジョブが稼働できない時間が発生することは想定していたが、
待機系サーバの再起動を行った際にジョブエラーが発生した。
調査したところ、同ジョブの仕様として稼働系→待機系にコマンドを飛ばしており、そこがうまくいかなったことが原因だった。
基盤というよりジョブの仕様の問題であり、今後類似作業を行う際は担当Tとの連携を密にしていきたい。