Microsoft, yönlendirici güncellemesinin Microsoft’un geniş alan ağını (WAN) etkileyerek Azure, Microsoft 365 uygulamalarını ve Power Platform’u geçen hafta boyunca küresel olarak erişilemez hale getirerek saatlerce süren büyük bir kesintiye neden olduğunu söylüyor.

Geçen Çarşamba günkü kesinti Microsoft Teams, Exchange Online, Outlook, SharePoint Online, OneDrive for Business, Microsoft Graph, PowerBi, M365 Admin Portal, Microsoft Intune, Microsoft Defender for Cloud Apps ve Microsoft Defender for Identity’yi etkiledi.

Kesintiden önce Microsoft, müşterilerin Public Azure, Microsoft 365 ve Power BI bölgelerindeki Azure kaynaklarına bağlanmaya çalıştıklarında planlanan bir güncellemenin gecikmelere veya gecikmelere neden olabileceğini müşterilere tavsiye etti. Ancak Avrupalı ​​işçiler güne başlarken herkes güncellemenin gecikmeden daha fazla soruna neden olduğunu fark etti.

Geçmeyen planlanmış bir değişiklik

Güncelleme, Microsoft’un WAN’ındaki ağ cihazlarını doğrudan etkiledi ve bu da veri merkezlerindeki hizmetler arasındaki bağlantıları azalttı. ExpressRoute üzerinden bağlantıların yanı sıra Microsoft’un özel ağı, müşterilerin veri merkezleri arasında veri aktarımı yapmasına olanak tanır.

Microsoft, olay sonrası ön inceleme çoğu bölge ve hizmette üretimin Çarşamba günü 09:00 UTC’ye kadar eski haline getirildiğini. Ancak tüm hizmetler 25 Ocak 12:43 UTC’de geri yüklendi. Microsoft’a göre kesinti, Azure genel bulutuna bağlı olan Azure Kamu bulut hizmetlerini de etkiledi.

Microsoft, raporunda “Microsoft’un geniş alan ağında (WAN) yapılan bir değişikliğin, İnternet ve Azure üzerindeki müşteriler arasındaki bağlantıyı, bölgeler arasındaki bağlantıyı ve siteler arasındaki bağlantıyı ExpressRoute yoluyla etkilediğini belirledik” diye açıklıyor.

“Bir WAN yönlendiricisinin IP adresini güncellemek için planlanan değişikliğin bir parçası olarak, yönlendiriciye verilen bir komut, mesajların WAN’daki diğer tüm yönlendiricilere gönderilmesine neden oldu ve tüm sunuculardan bitişikliklerini ve yönlendirme matrislerini yeniden hesaplamalarını istedi. Bu yeniden hesaplama işlemi sırasında , yönlendiriciler paketleri doğru bir şekilde iletemedi. Soruna neden olan komut, farklı ağ aygıtlarında farklı davranıyor ve komut, üzerinde çalıştırıldığı yönlendiricide tam yeterlilik sürecimiz kullanılarak doğrulanmadı.”

paket kayıpları

Microsoft izleme sistemleri, 07:12 UTC’de Etki Alanı Adı Hizmeti (DNS) ve WAN sorunları algıladı. Son değişiklikleri inceledikten sonra, Otomatik Kurtarma 08:20 UTC’de çalışırken mühendisler sorunlara neden olan “sorunlu komutu” keşfettiler.

Microsoft, “WAN’ın etkisi nedeniyle, cihaz tanımlama ve kaldırma sistemleri ve ağ üzerinden veri akışını optimize etmek için trafik mühendisliği sistemi dahil olmak üzere otomatik sistemlerimiz duraklatıldı” dedi.

“Bu sistemlerin duraklatılması nedeniyle, bazı ağ yollarında 09:35 UTC’den başlayarak, bu sistemler manuel olarak yeniden başlatılıp WAN en iyi çalışma koşullarına geri döndürülene kadar artan paket kaybı yaşadı. Bu kurtarma 12:43 UTC’de sona erdi.”

Microsoft şimdi, bunun tekrar olmasını önlemek için “cihazlarda yüksek etkili komutların yürütülmesini engellediğini” söylüyor.

Microsoft, önümüzdeki iki hafta içinde son bir olay sonrası raporu yayınlamayı planlıyor.

Bulut bilgi işlem kesintilerini daha derine inmek için


Kaynak : “ZDNet.com”



genel-15