Facebook, öğleden sonra 15:30 civarında bir tweet attı: “Dünyanın dört bir yanındaki bize güvenen büyük insan ve işletmeler topluluğuna: üzgünüz” dedi. Yerel zaman. “Uygulamalarımıza ve hizmetlerimize yeniden erişim sağlamak için çok çalışıyoruz ve şimdi tekrar çevrimiçi olduklarını bildirmekten mutluluk duyuyoruz. Bizimle birlikte olduğunuz için teşekkür ederiz.” diye kullanıcılarına olumlu bir sinyal verdi. Daha önce Whatsapp’la ilgili güvenlik sözleşmesi sıkıntısından dolayı ciddi bir sorun yaşanmıştı. Dün yine muhteşem 3’lü nedeni bilinmeyen bir nedenle çöktü. Facebook’un gün boyu süren kesintisi, bugüne kadarki en uzun ve en aşırı kesinti ve yıllardır böyle bir kesinti yaşanmamıştı. Sosyal devin merkezinin bulunduğu ABD Batı Kıyısında sabah saat 9 civarında PDT’de Facebook, WhatsApp, Instagram ve Facebook Messenger internetten kaybolmuş gibi görünüyordu ve Türkiye’de de akşam saatlerinde sıkıntı yaşanmaya başlandı.
Kesinti piyasa kapanışı boyunca devam etti ve şirketin hissesi Pazartesi günü açılış fiyatının yaklaşık %5 altına düştü. Facebook’un, şirketin sunucularını manuel olarak sıfırlamak için Santa Clara veri merkezine bir ekip gönderdiği bildirildikten sonra, öğleden sonra hizmetler devam etmeye başladı. Ancak kesintiyi benzersiz kılan şey, Facebook’un ne kadar çevrimdışı olduğu konusu ve bu süre gerçekten çok fazla.
Sabah Facebook yaptığı açıklamada, “bazı kişilerin uygulamalarımıza ve ürünlerimize erişmekte sorun yaşadığını” söyleyerek özür dilemek için kısa bir tweet gönderdi. Ardından, kesintinin yalnızca kullanıcılarını değil, şirketin kendisini de etkilediğine dair raporlar ortaya çıktı. Çalışanların ofis binalarına giremediği bildirildi ve personel bunu “kar günü” olarak nitelendirdi – kesinti dahili işbirliği uygulamalarını da etkilediği için herhangi bir iş yapamadılar.
Güvenlik uzmanları, kanıtların şirketin ağındaki Facebook’u daha geniş internetten ve ayrıca kendisinden kesen bir soruna işaret ettiğini söylese de, Facebook kesintinin nedeni hakkında yorum yapmadı. Ağ oluşturma devi Cloudflare CTO’su John Graham-Cumming’e göre, Facebook’un iki dakikalık bir pencerede “BGP güncellemelerinin telaşıyla internetten kaybolduğunu” söyleyen John Graham-Cumming’e göre, ilk sorun işaretleri California’da sabah 8:50 PDT’ydi. BGP veya Sınır Ağ Geçidi Protokolüne atıfta bulunarak, ağların internet üzerinden başka bir ağa veri göndermenin en hızlı yolunu bulmak için kullandığı sistem olarak nitelendiriyor.
Güncellemeler özellikle BGP rota çekimleriydi. Esasen, Facebook internete, kalesinin asma köprüsünü kapatmak gibi iş için kapatıldığına dair bir mesaj göndermişti. Ağa giden herhangi bir rota olmadan, Facebook temelde internetin geri kalanından izole edildi ve Facebook’un ağının yapılandırılma şekli nedeniyle, rota çekimleri WhatsApp, Instagram, Facebook Messenger ve dijital duvarlarının içindeki her şeyi de aldı. BGP rotaları geri çekildikten birkaç dakika sonra kullanıcılar sorunları fark etmeye başladı. Errata Security’nin kurucusu Rob Graham, bir tweet dizisinde, Facebook’a gitmesi gereken internet trafiğinin aslında internette kaybolduğunu ve hiçbir yere gitmediğini söyledi.
Kullanıcılar, Facebook uygulamalarının çalışmayı durdurduğunu ve web sitelerinin yüklenmediğini fark etmeye başladılar ve DNS veya internetin nasıl çalıştığının bir başka kritik parçası olan alan adı sistemi ile ilgili sorunlar yaşadıklarını bildirdiler. DNS, bir web sayfasının internette nerede olduğunu bulmak için insan tarafından okunabilen web adreslerini makine tarafından okunabilen IP adreslerine dönüştürür. Facebook’un sunucularına, uygulamalara ve tarayıcılara girmenin bir yolu olmadan, DNS hataları gibi görünen şeyleri geri tepmeye devam eden bir sistem var.
BGP güzergahlarının neden geri çekildiği tam olarak bilinmiyor. İnternetin ortaya çıkışından bu yana var olan BGP, büyük kesintilere yol açabilecek şekillerde manipüle edilebilir ve kötü niyetli olarak kullanılabilir. Daha olası olan şey, bir Facebook yapılandırma güncellemesinin çok yanlış gitmesi ve başarısızlığının internet boyunca kademeli olarak artması. Bir Facebook mühendisinden şimdi silinmiş bir Reddit ileti dizisi, yaygın olarak bilinmeden çok önce bir BGP yapılandırma hatasını açıkladı. Ancak düzeltme basit olsa da, internetin çalışma şekli nedeniyle kurtarma işlemi önümüzdeki birkaç saatten sonraki günlere kadar uzayabilir. İnternet sağlayıcıları genellikle DNS kayıtlarını birkaç saatte bir günceller, ancak tamamen yayılmaları birkaç gün sürebilir.
Image Credit: Social Picture