少し変わったインシデント管理の事例をご紹介

インシデント管理は、安定したシステム運用に欠かせません。システム運用上でのトラブルに対して、インシデントの発生を認識し、状況を把握、解決手順を構築し、インシデントを解決して状況復帰する事を指します。よくある事例で例えると、「ユーザーのパソコンからシステムにログインできない」と言ったインシデントが発生したとします。このログインできない事がインシデントです。パソコンが故障していた等の理由はインシデントの原因です。インシデント管理での対応策としては、パソコンを修理する他にも予備のパソコンを待機させておく等と考えることができます。そしてそれを実行に移し、無事ユーザーがログイン出来たら状況復帰完了となるのです。つまり障害への対応や障害からの復旧とは違い、システムを運用し続ける事に対策を講じる事が、インシデント管理なのです。

よくあるインシデントの事例をご紹介します

前段でインシデント管理とは何かを説明しましたが、ざっくり言えば、業務を止めてしまうあらゆるイベントの事を指します。詳しくはもっと細かい定義がされていますが、システムの利用者がやりたいと思ったことができない状態なのです。事例を挙げると、ソフトウェアを起動しようと思ったらパソコンが固まってしまった、印刷しようとしたらプリンターが動かなかった、メールを受信しようとしたらメールサーバからエラーが返ってきた、パソコンを立ち上げようと思ったら立ち上がってこなかった、ソフトウェアの使い方が判らないなんて事もインシデントに入ります。つまりインシデントと言うのは、やりたいことができない状態の事なのですね。プリンターが動かない状態がインシデントであり、紙やトナーが切れてしまっていたのが障害なのです。

インシデントの管理の事例について

インシデント=障害ではない事をご説明しました。障害とはインシデントを引き起こす原因のひとつなのです。先程プリンターが動かなかった事例を挙げましたが、このような事例には多重化するといった手段があります。プリンターを2台稼働させておき、片方に障害が起きてもどちらかで業務を継続できる状態にするのです。これであればインシデント管理が出来ているように思えますが、2台いっぺんに止まってしまう可能性も考えられます。例えば紙やトナーが切れてしまえば、いくらプリンター自体に問題が無くても業務は止まってしまい、インシデント発生となってしまいます。そのため機器を多重化するのなら、消耗品も多重化して在庫しておく必要があるのです。このように機器を多重化して止まらないように見えるが、消耗品の在庫管理を放置していたら、やりたい事が出来なくなる可能性が高い状態もまたインシデントなのです。