【サーバーNo.498】今更聞けない!コールドスタンバイをサクッと解説

サーバー サーバー
この記事は約7分で読めます。

コールドスタンバイについて知らない方に向けて、わかりやすく解説した記事をご用意しました。この記事では、コールドスタンバイの基本から具体的な活用例まで詳しく説明します。

スポンサーリンク

コールドスタンバイとは?

コールドスタンバイとは、システム障害やサーバーダウンなどのトラブル発生時に備え、待機状態の予備サーバーを用意しておく冗長構成の一種です。通常は稼働せず、メインサーバーが停止した場合に手動または自動で起動させ、サービスの継続を図ります。

わかりやすい具体的な例

ショッピングモールの予備発電機

flowchart TD A[メイン電源] -->|正常稼働| B[ショッピングモール営業中] A -->|故障| C[予備発電機起動] C --> B note1:::note --> A[メイン電源]: メインの電源が正常に動作している場合 note2:::note --> C[予備発電機]: トラブル時にのみ起動する待機装置 classDef note fill:#f9f,stroke:#333,stroke-width:1px;

ショッピングモールで例えると、普段は商業施設のメイン電源だけで営業しています。しかし停電が起こると予備発電機が起動し、電気が復旧するまで店内の営業を支えます。

会社のバックアップパソコン

flowchart TD A[メインPC] -->|通常使用| B[業務遂行] A -->|故障| C[バックアップPC起動] C --> B note1:::note --> A[メインPC]: 日常的に使用する主力パソコン note2:::note --> C[バックアップPC]: 故障時に立ち上げる予備パソコン classDef note fill:#f9f,stroke:#333,stroke-width:1px;

会社では普段メインのパソコンを使って仕事をしていますが、万が一メインのパソコンが故障した場合に備えて、予備のバックアップパソコンを準備しておくのがコールドスタンバイの考え方です。

スポンサーリンク

コールドスタンバイはどのように考案されたのか

コールドスタンバイは、システム障害による業務停止を防ぐため、1970年代のメインフレーム時代に考案されました。当時、大規模なビジネスではシステムダウンが直接的な損失につながるため、障害時にも迅速に復旧できる方法が求められていました。

flowchart TD A[1970年代: メインフレーム時代] --> B[システム停止の損失リスク] B --> C[復旧対策の必要性] C --> D[コールドスタンバイ考案] note1:::note --> D[コールドスタンバイ]: 障害時に備えて予備機を待機 classDef note fill:#f9f,stroke:#333,stroke-width:1px;

考案した人の紹介

コールドスタンバイの概念は、IBMのエンジニアであるロバート・L・パトリック氏が中心となって考案しました。彼はメインフレームの安定稼働を追求する中で、トラブル発生時にもビジネス継続を可能にする方法としてこの構成を導入しました。パトリック氏はシステムの信頼性向上に多大な貢献をしています。

考案された背景

1970年代は金融機関や大手企業がコンピュータ化を進めていた時代です。システム障害が発生すると業務が全面停止し、経済的損失が甚大でした。そのため、障害時の復旧時間を短縮する方法としてコールドスタンバイが導入されました。

コールドスタンバイを学ぶ上でつまづくポイント

多くの人がコールドスタンバイとホットスタンバイの違いで混乱します。ホットスタンバイは常時稼働状態で即座に切り替わるのに対し、コールドスタンバイは待機状態で手動起動が必要です。特に「即時性の違い」と「コスト面の違い」を理解することがつまづきやすいポイントです。

スポンサーリンク

コールドスタンバイの構造

コールドスタンバイの構造は、プライマリサーバーセカンダリサーバーの2層構成が基本です。プライマリサーバーが通常稼働し、障害発生時にセカンダリサーバーを手動またはスクリプトで起動します。データ同期は定期的に行われ、復旧後は手動で切り戻しを実施します。

flowchart LR A[プライマリサーバー] -->|通常稼働| B[サービス提供] A -->|障害発生| C[セカンダリサーバー起動] C --> B A -.->|定期データ同期| C note1:::note --> A[プライマリサーバー]: 通常使用する本番サーバー note2:::note --> C[セカンダリサーバー]: 待機中の予備サーバー classDef note fill:#f9f,stroke:#333,stroke-width:1px;

コールドスタンバイを利用する場面

主に大規模な金融機関や医療機関など、システム停止が許されない場面で利用されます。

利用するケース1

銀行のATMネットワークでは、365日24時間稼働が求められます。メインサーバーに障害が発生した場合、コールドスタンバイの待機サーバーが起動し、ATMの利用を止めることなくサービスを提供し続けることができます。この仕組みにより顧客の信頼を損なわずに済みます。

flowchart TD A[ATMメインサーバー] -->|通常稼働| B[ATM稼働] A -->|障害| C[スタンバイサーバー起動] C --> B note1:::note --> A[ATMメインサーバー]: 通常稼働のサーバー note2:::note --> C[スタンバイサーバー]: 障害時の予備サーバー classDef note fill:#f9f,stroke:#333,stroke-width:1px;

利用するケース2

病院の電子カルテシステムでは、患者情報の継続的な閲覧が不可欠です。メインの電子カルテサーバーがダウンした際、コールドスタンバイの待機サーバーを起動させ、診療業務に支障が出ないよう対応します。これにより、患者の安全と診療のスムーズな継続が確保されます。

flowchart TD A[電子カルテメインサーバー] -->|通常稼働| B[診療業務] A -->|障害| C[スタンバイサーバー起動] C --> B note1:::note --> A[電子カルテメインサーバー]: 日常使用するサーバー note2:::note --> C[スタンバイサーバー]: トラブル発生時用の予備 classDef note fill:#f9f,stroke:#333,stroke-width:1px;

さらに賢くなる豆知識

コールドスタンバイはコストを抑えつつ信頼性を高める方法ですが、クラウド環境では柔軟に自動化できるのも特長です。最近では、クラウドのスナップショット機能と組み合わせ、従来よりも迅速な復旧が可能になっています。

スポンサーリンク

あわせてこれも押さえよう!

コールドスタンバイの理解を深めるために、関連するサーバー構成や用語も一緒に学んでおくとより効果的です。以下の5つのキーワードについて簡単に説明します。

  • ホットスタンバイ
  • 待機サーバーが常時稼働し、即座に切り替え可能な構成です。

  • アクティブ-アクティブ構成
  • 複数のサーバーが同時に稼働し、負荷分散と冗長性を確保する方法です。

  • フェイルオーバー
  • 障害発生時に自動で別サーバーに切り替える仕組みを指します。

  • データレプリケーション
  • リアルタイムでデータを複数サーバー間で複製する技術です。

  • ディザスタリカバリ
  • 災害発生後にシステムを復旧させるための全体的な対策手法です。

まとめ

コールドスタンバイを理解することで、障害発生時にも落ち着いて対処できる知識が身につきます。日常のシステム運用だけでなく、BCP対策やクラウド環境の設計にも役立つスキルです。信頼性の高いシステム構築を目指す上で欠かせない知識です。

スポンサーリンク