どのような業務か
「システムが正常に稼働しているかどうかを、日々システムを動作させることにより監視する」のが「運用」です。
具体的には以下のような作業が挙げられます。
- システムを定時に起動及びシャットダウンする「システムのON、OFF作業」
- 定期的な「データのバックアップ作業」
- ログを確認したりメモリの状態をチェックし
- システムが正常に動いているか監視を行う「システム稼働監視」
- ウイルスなどにより外部からの攻撃や情報流出の発生は無いか等をチェックし、担当者への報告を行う「セキュリティ監視」
また、「メンテナンスやアップデート等の導入を行うことで、システムの改修や調整、修理をする」のが「保守」です。
運用と大きく違う部分として、システムに対して変更を加える点が挙げられます。
バグの改修やDBのチューニング、サーバ機器等のリプレースも保守の作業範囲です。
なぜ必要か
システムに何らかの障害が発生していたり、システム自体が停止してしまった時に、
すぐに復旧できなければどうなるのでしょうか。
例えば、社内の業務システムが数日間利用できなくなると、仕事そのものができなくなり
ビジネスがストップしてしまいます。
そのようなことが起きないように、「運用」「保守」両方の業務が
稼働中のサーバを停止させない/停止したとしてもダウンタイムを最短にするという
同じ目的を持って協力・連動して動いていく必要があります。
システム障害が発生する3つの理由
システム障害が発生する原因は3つに分けることができます。
- 人為的ミス
例えば、最適なシステム設計・最適なシステムサイズであっても人為的な操作ミスや設定ミスが発生します。 - システムの構成設計ミス
機器構成における根本的なミスはコンピューター自身が異常を知らせてくれます。 - システムのサイジングミス
システムの設計に際し、利用規模や性能、容量が過少だとピーク時の負荷に耐えられず障害が発生します。サイジングの想定が過大すぎるとコストの無駄が発生します。
システムってどんな障害が発生するの
システム障害には、大小さまざまなものがありますが、具体的には以下のようなものが挙げられます。
- プログラムのバグ
- デッドロックの発生
- アクセス過多によるサーバーダウン
- ハードウェアの故障
- 通信ケーブル切断
- オペレーションミス
- セキュリティシステムにおける暗号化認証有効期限切れ
- システム更新時の再起動失敗・設定ミス
- コンピューターウイルスによるシステムへの攻撃
- 災害による通信不良・機器の故障
- 外部サービスのシステム障害により発生するシステム障害
などの様々なシステム障害があります。
最後に
「運用保守」業務があることによってシステムが円滑に稼働しており、障害が発生した場合でも迅速な対応をすることができます。
「運用保守」はIT業界の「縁の下の力持ち」であり、これからもIT社会の発展には欠かせない大きな存在です。