当社エンジニアによる書き下ろし技術レポート Close-Up IT

技術レポート 新着RSS(Atom)

この記事に関連するサービス
センター運用業務の継続的実施
この記事に関連するお問い合わせ
お問い合わせ

第2章 :9つの「管理項目」の概要

17システム運用 「回復管理」のポイント

1. さまざまな障害を想定し事前に回復手順を完備

回復処理は、迅速・確実に行わなければなりません。障害発生の都度、対応方法を検討したり、手順化されていない方法で回復を試みると、無駄な時間を要したり、障害を悪化させる危険も大きくなります。回復処理を確実に実施するためには、前もって、想定できる限りさまざまなシステム停止状態からの回復手順を網羅的に整備しておくことが必須です。

2. 障害回復の鍵はコントロール

障害を速やかに回復させるために最も大切なのは統制です。一つ一つの現象に対してそれぞれの対応者が無秩序に対応を行えば、事態をさらに悪化させてしまうこともありうるからです。こういった事態を避けるために、一人の監督者 (コントローラー) をあらかじめ設定しておき、障害が発生した場合には、情報の集中管理と指揮命令体系の一本化を計ることが大切です。同時に、利用者への広報内容を統一し混乱を抑えることで、対応負荷の軽減を計ることができます。

3. 回復計画の見直しも重要

障害を想定する中で、サービスレベルを維持できない事態が考えられた場合には、原因を根本的に除去する対策が必要となります。"障害を起こさないようにする"対策は「問題管理」の守備範囲と重複する感がありますが、回復管理側から情報化計画などにフィードバックを行うことは重要です。例えば、設備の増強 (データの物理的破壊に対する二重化や自動切替の準備)、手順の見直し (回復計画の見直し) などがこれに相当します。もちろん、根本対応を実施する際には、障害による損失に対して費用的に見合った対策となっているかの確認が必要となります。

このページの先頭へ