メインコンテンツにスキップ
セキュリティ& レジリエンシー

高可用性とデータ復旧に関する通説と計画 | Kyndryl

お知らせ 2023/07/05 読み取り時間:
Duncan Bradley著

最近のお客様との会話の中で、高可用性とデータレプリケーションへの投資について誤解があることが分かりました。

多くの企業は、これらの投資によって論理的データの破損をもたらすサイバー攻撃を受けた際に自社を守ることができると信じています。

しかし、そのようなことはありません。

オンプレミス、クラウド、SaaSベースのシステムなど、重要なデータがどこにあるかは関係ありません。論理的データの破損を引き起こす多くのサイバー攻撃では、破損は高可用性ソリューションやデータ複製ソリューション全体にレプリケーションされます。

レプリケーションはオンラインにあるデータを全て破壊します。可用性の高いレプリケーションソリューションが攻撃を加速させるため、全てのサーバーが暗号化されてしまうのです。こうなってしまうと、サーバーイメージとデータをバックアップから復元しなくてはなりません。

バックアップに不変性を求めるのは良いのですが、重大な障害を回避するには十分ではありません。ほとんどのバックアップソリューションは、何百台ものサーバーや何テラバイトものデータを数時間以内に復旧できるようには設計されていないのです。

私は、この現実に目を向けていない企業を数多く目の当たりにしました。多くの企業は、数週間単位で時間をかけないと環境を復元できないことに気付いていません。現在のバックアップアプローチでは、感染を一掃した後、データ復旧を開始する際に多くのサーバーを再構築する必要がありますが、その準備が十分ではありません。

今こそデータとサーバーの復旧機能を再評価し、ビジネスニーズを満たしていることを確認するタイミングです

変化する災害復旧シナリオ

ここ20年間で、ほとんどの企業がインフラを統合させる方向へ向かっています。クラスタリングに多額の投資を行い、ますます厳しくなる可用性のサービスレベル合意書(SLA)を満たすために、重要なシステムにストレージレプリケーションを導入してきました。

このアプローチは、火災、洪水、ネットワーク停止といったトラブルから企業を守ることができるかもしれません。しかし、ここ数年の災害復旧のシナリオは劇的に変化しており、ほとんどの企業はランサムウェアの脅威へ対応するための変更は実現できていません。

ランサムウェアの被害からの復旧時には、サーバーとデータをバックアップから復旧させる必要があります。そのためには、多くの場合、攻撃の種がまかれる前の、何週間も前のバージョンのサーバーイメージから復元させなくてはいけません。

このようにランサムウェアの被害を受けた後に復旧するには、適切なデータバックアップ保護のソリューションが必要です。

  • エアギャップ保護: バックアップデータは、本番データと物理的または論理的に分離されており、サイバー侵害が発生した場合でも安全です。
  • イミュータビリティとデータ保護: 一度書き込まれたバックアップデータは、サイバー攻撃によって変更されたり失効したりすることはありません。
  • データの保持: 一度書き込まれたバックアップデータは、サイバー攻撃によって変更されたり失効したりすることはありません。
  • 一括復旧: 企業の重要システムをビジネスへの影響の許容範囲内で復旧させます。

私が相談を受けるお客様の中には、保護と復旧可能性をさらに高めるための取り組みを進めている企業もありますが、他の多くのお客様はいまだに危険にさらされています。心配なことに、彼らは自社が危険にさらされていることにも気付けていません。

例:最近のRFPの仕様

今年の初め、私は新しいサイバーバックアップ保護ソリューションのRFPを受け取りました。依頼主は、現在のバックアップソリューションをサイバー・バックアップ・ソリューションに置き換えてほしいと述べていました。

要件は、重要なシステムに以下を提供することでした。

  • 15分の目標復旧時点(RPO)ーつまり、実質的にデータ損失をゼロにすること
  • 30分の目標復旧時間(RTO)ー事実上の即時復旧*現在のバックアップスケジュールは週1回のバックアップと毎日の増分バックアップ

これらの要件を満たすことは可能かもしれませんが、バックアップポリシーの全面的な再設計だけでなく、サポートするコンピューティング、ストレージ、ネットワークインフラにも大きな変更を加える必要があります。

私は、最小限の企業インフラでもサーバーやデータの復旧に要する日数は10日以上かかると示されているデータ復旧に関するアドバイスを多数目にしてきました。

このお客様のバックアップおよび復元サービスは全てのSLAを満たしているにもかかわらず、サーバーデータのごく一部しかバックアップできていませんでした。過去20年間、毎晩のバックアップはSLA内で完了し、毎月の復元テストでは一貫性のあるデータがバックアップされていました。しかし、日々行うバックアップのほとんどは増分バックアップで、つまりサーバーデータのごく一部しかバックアップできていないことになります。

また、複数のサーバーを一括復旧すると、バックアップ環境やネットワークに大きな負荷がかかり、さらに時間を要してしまいます

データ復旧機能を向上させる方法

上述の課題は最近のお客様との会話でも出てきました。

大規模なデータ破損が発生した場合、そのリスクを軽減する必要があるのか、あるいは軽減したいのかについて、十分な情報を得た上で決断を下すことが求められます。そのためには、データやサーバーの復旧に必要な機能に対する理解が必要です。  

復旧機能を向上させたいと考えているのであれば、RFPを進めるのではなく、まずは以下のように全体的なアプローチを検討することが重要です。

  • 重要なサーバーとデータ量を特定し、どのシステムにそれらを保存するかを確認します。また、どの程度のデータ損失に耐えられるかを理解することも重要です。
  • どのシステムを最初に復旧させる必要があるのか、また、どのようなビジネス許容期間で復旧させる必要があるのかを明確にします。ビジネスプロセスやアプリケーションに簡単な変更を加えるだけで、基盤となるシステムの重要度を下げることができます。
  • クラウドやSaaSソリューションにあるデータについて考慮することも忘れてはいけません。これらの場所も同様に脆弱であることを認識しましょう。

保護する必要があるデータが多ければ多いほど、より迅速に復旧する必要があります。データ損失に対する企業の耐久性は、十分なサーバーとデータ復旧ソリューションを導入する際のコストを大きく左右します。

Duncan Bradley は、キンドリルUKIのサイバーレジリエンシー担当プラクティスリーダー兼カスタマーエンゲージメント担当理事です。