SLA anlaşmalarda Uptime nedir? Nasıl Hesaplanır?

99,9 % uptime
99,9 % uptime

Uzunca bir süredir içerik üretmeye zaman bulamadım. Bu makalede Server- Network operasyonlarında SLA(service level agreements) anlaşmalarındaki Uptime hesabı ve Uptime konusunda bazı konulara değinmek istiyorum.

Öncelikle Uptime nedir?

Eğer bunu network hizmeti satan bir Datacenter ile görüşme sırasında soruyorsak Network’ün erişilebilirlik hesabı,

(Not: 09.12.2020, 2012 yılında paylaştığım bu yazıda bilgiler bugün halen geçerlidir… Yazı orjinalinde yer alan eski şirketimin adını silmeyi tercih ettim…)

Eğer bir web hosting firmasındaki web sunucuda çalışan web server yazılımının cevap vermesi için soruyorsak servisin erişilebilirlik hesabı,

Eğer bir web hosting firmasındaki web sunucuda bulunan sitemizin açılma hızı ve açılma oranı için soruyorsak web sitesinin tüm içeriği ile eksiksiz yüklenmesi durumu için ayrı ayrı konuşmak gerekiyor.

Uptime hedeflediğiniz servisin ulaşılabilirlik hesabıdır.

Uptime hesaplamada hedef servisin durumuna göre zamanlar söz konusudur ve SLA anlaşmanıza göre % hesabı üzerinden tutulmaktadır. Aşağıda yaklaşık olarak % oranlar ve bunların ne kadar süre kesintiye neden olduğu ile ilgili bir tablo yer almaktadır. (kaynak:http://en.wikipedia.org/wiki/High_availability)

Availability %

Downtime per year

Downtime per month*

Downtime per week

90% (“one nine”) 36.5 days 72 hours 16.8 hours
95% 18.25 days 36 hours 8.4 hours
97% 10.96 days 21.6 hours 5.04 hours
98% 7.30 days 14.4 hours 3.36 hours
99% (“two nines”) 3.65 days 7.20 hours 1.68 hours
99.5% 1.83 days 3.60 hours 50.4 minutes
99.8% 17.52 hours 86.23 minutes 20.16 minutes
99.9% (“three nines”) 8.76 hours 43.2 minutes 10.1 minutes
99.95% 4.38 hours 21.56 minutes 5.04 minutes
99.99% (“four nines”) 52.56 minutes 4.32 minutes 1.01 minutes
99.999% (“five nines”) 5.26 minutes 25.9 seconds 6.05 seconds
99.9999% (“six nines”) 31.5 seconds 2.59 seconds 0.605 seconds

Network Uptime durumu?

Network uptime durumu hesabında yine farklı kriterler vardır. Örnek olarak hedeflenen network’e farklı noktalardan erişim var mı? Erişim var ise LATENCY yani gecikme süresi anlaşmasının durumunun ne olduğu alt detaylar önem kazanır. Network kontrollerinde farklı noktalardan testler yapmak hayati önemlidir. Internet birbirinden bağımsız pek çok network’ün farklı politikalar ile birbirine bağlı olduğu bir mecradır ve bu mecrada örnek olarak almanya üzerinden erişen kullanıcılar sitenize sorunsuz olarak erişebilirken fransa üzerindeki kullanıcıların size ulaşamama şansı bulunmaktadır. Üstelik bu şans sadece sizin servis aldığınız şirkete de bağlı değildir. Bu nedenle SLA anlaşmanızda bu erişilirliği iyi analiz ederek sözleşmeye yazmakta fayda vardır.

Yine aynı örnekten yola çıkarsak, almanya üzerinden erişen kullanıcılar size sorunsuz erişiyor. Erişim süresi yani latency 60 MS. Fransadaki kullanıcılarda sorunsuz erişiyor, fakat bu erişimde latency 300 MS. Bu noktada eğer siz sözleşmenizde LATENCY anlaşmasını doğru şartlandırmadı sadece paketin erişme süresine imza atmış iseniz yine zor durumda kalabilirsiniz. Bu nedenle LATENCY değerlerinide belirtmek faydalı olacaktır.

Ben şahsen bildiğim bazı noktalar ile ilgili latency değerlerini paylaşmak istiyorum. Bu değerleri sözleşmenizde referans noktası olarak kullanabilirsiniz.

İstanbul- Almanya ~60 MS
İstanbul-Hollanda ~65 MS
İstanbul-Fransa ~65 MS
İstanbul-Newyork ~190 MS

Network’ün ayakta tutulması Datacenter’ın görevidir. Datacenter ilgili müşterisinin ana ekipmanına kadar yani backbone erişimine kadar network servisini sağlamakla görevlidir. Ülkemizdeki pek çok datacenter internet’e sadece 1 fiziksel erişim üzerinden bağlanır. Datacenter şirketleri daha ilk nokta itibari ile uplink olarak tek path yani kısıtlı erişim durumundadırlar. Buna ek olarak fiziksel

Bizim Datacenter içerisinde 2 farklı fiziksel güzergah üzerinden ve 2 farklı Türk Telekom santrali üzerinden internet erişimi alınmaktadır. Bu erişimler N+1 kapasitede planlanmış olup yapılandırmada 1 Santral üzerinde arıza durumunda müşterilerimize kesintisiz ve sorunsuz erişim sağlamayı hedeflemiş durumdayız.

Yedekli PATH Türk Telekom erişimine paralel olarak Turkcell Superonline üzerinden İstanbul’un en büyük ve bize en uzak santrallerinden KARTAL ve GAYRETTEPE santraline doğru 2 farklı güzergah üzerinden de erişimlerimiz bulunmaktadır.

Bu erişimler 2 farklı fiziksel router cihazında sonlandırılır. Router Cihazlarımız 1 adet Juniper MX960 (960 Gbit full redundant + 32x 10 Gbit, 192x 1 Gbit port), 1 Adet Juniper MX240 (4×10 Gbit, 24×1 Gbit) ve 1 Adet Brocade XMR 16 (16×10 Gbit, 96×1 Gbit) kapasiteli N+N yani %100 yedekli Backbone Router cihazları ile sonlandırılmaktadır.

Bu yapılandırma şirketimin %99,999 internet erişim kapasitesinin bel kemiğini oluşturmaktadır.

Web Server Servisi Uptime durumu?

Web servis servisi, sunucu üzerindeki web server yazılımının cevap verme oranıdır. Bu oran ölçümünde genelde izleme yazılımları sunucu yazılımının takip ettiği genelde 80. port’a TCP erişim yaparak kontrol ederler. Bu kontrol sırasında web sitenizin içeriğine dair bir kontrol yapılmaz. Bu nokta önemlidir. Çünki sadece tcp port takibi olduğu durumlarda web siteniz içerisindeki aktif PHP/ASP gibi yazılımsal içeriğin gerçekten ne seviyede erişilebildiğinin kontrolü yapılmaz.

Bu yüzden SLA anlaşmalarınızda web siteniz ile ilgili bir şart düşünüyorsanız mutlaka ama mutlaka izleme sistemi olarak web sitenizin içeriğini kapsayan bir monitoring sistemi servisi almanızı öneririm.

Aksi halde web sayfanızın içeriğini üreten sql sunucudaki bir arıza veya disk üzerindeki herhangi bir arızadan ötürü web siteniz çalışmazken web server tcp port cevapları vereceğinden herhangi bir DOWN değer ölçülmeyecektir.

Web Sitesi Uptime durumu?

Web sayfanızın uptime oranına gelince, bu konuda en doğru izleme metodu bence sayfanız içerisine gizli bir html kod eklemek ve takip yazılımlarına bu koda erişip erişmedikleri şekilde bir ayarlama yapmaktır. Bunu yapmanız durumunda monitoring sistemleri sizin web site içeriğinizin doğru ve eksiksiz gelip gelmediğini izleyebilir, sayfanızın ne kadar sürede yüklendiğini kontrol edebilir ve bu konuda bir yavaşlık durumunda alarm vererek downtime raporları tutmanızda yardımcı olacaktır.

Web Sayfası uptime oranı için SadeceHosting bünyesinde bu servisi sağlamakta ve içerik kontrollerini yapabilmekteyiz.

Uptime nasıl ölçülmelidir?

Bu işin doğrusu mümkünse ülkemiz içerisindeki farklı bölgelerde bulunan alt yapılar üzerinden farklı operatör bağlantılarından kontrol etmek üzerine kurulmalıdır. Örnek olarak Adana bölgesinde bir TTNET ADSL erişimi üzerinden ve İzmir bölgesinde Superonline Fiber noktasından aynı anda raporlar alınması hem bölgesel farklar hem de erişim kalitesi için önemlidir. Buna ek olarak Yurtdışı noktalarındanda testler yapmak servislerinizin dünya üzerinden erişimleri için oldukça doğru olacaktır.

Eskilerden Whatsup(Liseliler bilmez) adında bir yazılım kullanılan bu işlerde artık çok daha komplex sistemler kullanılmaktadır.

Datacenter içerisinde ülkemizdeki 3 farklı bölgede toplamda 6 farklı erişim şebekesinden, avrupa ve amerika kıtası üzerindende 4 farklı node üzerinden erişim kalitemiz takip edilmektedir.

Bu takiplerde Nagios ve Linux tabanlı 2 farklı yazılım kullanılarak hata oranı ve takip kayıtları maksimum durumda tutulmaktadır.

Bu tür bir takipte bölgesel arızalar veya yavaşlık sorunları çok hızlı fark edilerek müşterilerin etkilenmesine ihtimal vermeden önlenebilmektedir.