Birçok şirket, bulut tabanlı uygulamaları için olağanüstü durum kurtarma stratejilerine sahip olma ihtiyacını hafife alıyor. Ancak, sorunları anlayanlar bazen etkili planları uygulamaya koymakta zorlanırlar.

Basit BT görevlerini gerçekleştirmenin aksine, bu planların tamamlanması için yakın işbirliği ve birden çok tarafın taahhüt etmesi gerekir. Birçok BT hizmeti artık bazıları bulutta ve diğerleri veri merkezlerinde çalıştırılabilen birden çok uygulama bileşenine güveniyor. Bu nedenle, etkili bir olağanüstü durum kurtarma planı oluşturmak, yalnızca bireysel iş yüklerine değil, bir bütün olarak BT hizmetlerinin esnekliğine odaklanan yapılandırılmış, işlevler arası bir yaklaşım gerektirir.

Zor soruları cevaplayın

Felaket kurtarma planlamasına yaklaşmak için şirketlerin, bazı rahatsız edici soruları gündeme getirse bile yaklaşımlarını sorgulamaları gerekir. Bu süreç özellikle yararlıdır, çünkü şirketler boşlukları işaret ederek çabaları yeniden yönlendirebilir ve riskleri gözden kaçıran paydaşları harekete geçirebilir.

Bir iş yükü başarısız olduğunda, desteklediği hizmet kesintiye uğrar, bu da kullanıcı üretkenliğini etkiler ve müşteri güvenini zedeler. Hizmetin eski haline getirilmesi biraz koordinasyon gerektirir ve özellikle hasarın boyutunu sınırlamak için hızlı bir şekilde gerçekleştirilmelidir. Ayrıca, olağanüstü durum kurtarma prosedürlerinin yürürlükte olduğundan emin olmanın şirketlerin (bulut hizmeti sağlayıcılarının değil) sorumluluğunda olduğunu unutmayın.

Bir felaket kurtarma planı geliştirin

Etkili olağanüstü durum kurtarma planlaması, kesinti süresinin işletme üzerindeki etkisinin değerlendirilmesiyle başlar. Bu çapraz işlevli alıştırma, şirket tarafından kullanılan tüm BT hizmetlerini tanımlar, bir hizmet kesintisinin yaratabileceği etkiyi (operasyonel ve finansal) ve sonuç olarak her hizmet için olağanüstü durum kurtarma gereksinimlerini belirler. Birçok BT kuruluşu bir hizmet kataloğu tutar ve kapsamlı bir BT hizmetleri listesini belirleme sürecini basitleştirmek için tasarlanmış bir Yapılandırma Yönetimi Etkin Veritabanına (CMDB) sahiptir. Böyle bir kataloğun olmaması durumunda envanter, bir keşif süreci çerçevesinde oluşturulmalıdır.

Olağanüstü durum kurtarma gereksinimi düzeyini belirlemek için iki temel parametreyi dikkate almak yararlıdır: kurtarma süresi hedefi (RTO) ve kurtarma noktası hedefi (RPO). RTO, işletmenin belirli bir BT hizmeti için tahammül edebileceği kesinti süresini (genellikle saat, gün veya hafta olarak ölçülür) temsil eder. Öte yandan, RPO, şirketin bu aynı hizmetlerin her biri için kabul edebileceği veri kaybı miktarıdır (genellikle neredeyse sıfır ile birkaç saat arasında).

Uygulamada, genellikle bu iki hedef arasında bir denge vardır: örneğin, BT hizmetleri hızlı bir şekilde iyileşebilir, ancak daha fazla veri kaybına uğrayabilir ve bunun tersi de geçerlidir. Mantıksal olarak, zorlu RTO’lar ve RPO’lar genellikle daha pahalı teknolojik çözümlerin uygulanmasını gerektirir.

Bağımlılık haritalama ve teknoloji değerlendirmesi

RTO’ları, RPO’ları ve bir kapatmanın çeşitli BT hizmetleri üzerindeki etkisini belirledikten sonraki adım, bağımlı oldukları tüm BT uygulama bileşenlerini anlamaktır. Her BT hizmeti için bir bağımlılık haritası oluşturmak, ister veri merkezlerinde ister bulutta çalışıyor olsunlar, gerekli tüm uygulama bileşenleri için uygun kurtarma önlemlerinin alınmasını sağlamaya yardımcı olacaktır.

Ardından, şirketlerin RTO’ları ve RPO’ları toplu olarak değerlendirip değerlendiremeyecekleri de dahil olmak üzere her uygulama için veri koruma ve esneklik yeteneklerini değerlendirmeleri gerekir. Bu değerlendirme, en ciddi başarısızlığın etkisi göz önünde bulundurularak bütüncül olarak yapılmalıdır. Örneğin, gerekli kurtarma süresi içinde tek bir uygulamayı kurtarmak için doğru teknoloji zaten mevcut olabilir, ancak bu teknoloji şu anda onlarca, yüzlerce hatta binlerce uygulamayı paralel olarak kurtarıyor mu? Şirketler, bulutta olduğu gibi veri merkezlerinde de aynı teknik çözümleri kullanabilir mi? Birden fazla araca duyulan ihtiyaç, kurtarma prosedürlerini inkar edilemez bir şekilde karmaşıklaştıracaktır. Mevcut teknoloji yeteneklerini değerlendirdikten sonra işletmeler, boşlukları doldurmak için ek teknik çözümler belirleyebilir.

Kurtarma adımlarını belgeleyin ve test edin

Doğru kurtarma araçlarını kullanmak çok önemli olsa da, olağanüstü durum kurtarmayı garanti etmek için teknoloji tek başına yeterli değildir. Kritik bir adım, işletmeyi kurtarma süreci boyunca yönlendirmek için kullanılabilecek hiyerarşik bir kurtarma planları seti oluşturmaktır. Üst düzey planlar, kurtarma faaliyetlerinin nasıl koordine edildiğini belgeleyecekken, alt düzey planlar, her bir BT hizmetinin kurtarılmasını sağlamak için adım adım prosedürleri içerecektir. Bu planları geliştirmek ve sürdürmek önemli bir yatırımdır, ancak büyük bir olaydan etkili bir şekilde kurtulmayı sağlamak için gereklidir.

Planların uygulamada iyi çalışmasını sağlamak için düzenli olarak test edilmelidir. Testler yılda en az bir kez ve kritik uygulamalar için daha sık yapılmalıdır. Canlı verilerin kullanımını içeriyorlarsa, bir olay riski de olabilirler. Ancak test etme, olağanüstü durum kurtarma planlamasının göz ardı edilmemesi gereken önemli bir parçasıdır.

Dayanıklılık Oluşturma

Genel bulut, işletmelere iş yüklerini barındırmak için yüksek düzeyde ölçeklenebilir ve esnek bir platform sunar. Doğru kullanıldığında BT hizmetlerinin dayanıklılığını artırabilir. Ancak, genel bulutu benimsemek, kuruluşu hizmet kullanılabilirliği ve olağanüstü durum kurtarma konusundaki sorumluluğundan kurtarmaz. Bulut, bir kurtarma stratejisini desteklemek için birçok yapı taşı sunsa da, şirketler bunları uyumlu bir plan oluşturmak için diğer teknolojiler ve prosedürlerle birlikte kullanmalıdır.

Çoklu bulut esnekliği elde etmek, bazı unsurları olağanüstü durum kurtarma süreciyle ortak olan veri varlıkları etrafında bütünsel bir yaklaşım gerektirir. Çoklu bulutta olağanüstü durum kurtarma, verilerin depolandığı yerle ilgili diğer sorunları ortaya çıkarır. Mevcut bağımlılıklar ve bulut sağlayıcıyla ilgili olumsuz bir durum olması durumunda verilerin ve iş yüklerinin nasıl kurtarılabileceği.

Olağanüstü durum kurtarma planlaması ve testinin amacı, kurtarmanın RPO ve RTO hedeflerine göre mümkün olmasını sağlamaktır. Bu özellikle, hem dahili hem de harici şirketlerin müşterilerine, kesinti durumunda etkilenmeyecekleri konusunda güvence verecektir.



genel-15