障害調査について
ユーザ申告などで障害が報告された場合はスピード感と正確性をもって調査し、すぐに対応、そして原因や進捗などをすぐにユーザに報告しなければならない。そこで実際に何を行なえばよいのか考えてみましょう。
障害調査は「障害内容報告」、「原因究明」、「原因影響報告」、「対応」、「対応報告」、「対応後」のフェーズがあります。各フェーズで行なう内容は以下のものがあります。
・障害内容報告(時間を掛けない)
:一次切り分け
∴何が起きているのか?
∴影響と影響範囲は?
・ユーザー影響
:誰と誰になど
・他のシステムへの影響
・影響範囲:どのデータ?
:件数
∴どうにかして過去の何かと比較する
・時間軸:どのタイミングで発生
・原因究明(少し時間を掛ける)
:調査の人の確保
∴役割分担の確定
:影響調査
:原因調査
・原因影響報告
:原因
∴なぜ起きたのか条件など
:影響
∴どの辺りに影響があるのかデータや人など
:対応方法
∴いつのタイミングで何をすれば最適で影響が出ないもしくは最小限か
・対応
:何を直せば良いのか
:直したものをどう、いつ流せば良いのか
:その対応が適切なのか判断
:テスト対策
∴何をどうテストすればOKか
・対応報告
:直せるのか、直せないのか
∴直せないのであればどうすれば良いのか:最悪止める、切り戻す
・対応後
:対応が完了したのか確認
:テスト
∴何をどうテストしたか
ちなみにディスプレイやパソコンの電源が入らない場合は電源コードがきちんと刺さっているかまずは確認しましょう。