Performans Değerlerinde Doğru Ortalamayı Kullanmak

Tarik Guney
3 min readFeb 4, 2018

Bu sefer başlığı, anlatmak istediğim konuyu daha doğru bir şekilde anlatacak şekilde seçtim. Performans ölçümleri yaparken tüm değerleri teker teker incelemek yerine ortalamalarını almayı ve onlar üzerinden kararlarımızı vermeyi yeğliyoruz. Bu hesaplamalar rakamlar içinde boğulmadan karar alabilmek için önemli. Mesela, bir websitenizin sayfalarının ne kadar hızlı açıldığını ölçmek istiyorsunuz. Normalde bunun için stress testing yapar ve ölçümlerinizi sonradan değerlendirmek üzere saklarsınız. Şimdi konumuza bir örnek üzerinden devam edelim.

Ufak Bir Not

Örneğe girmeden önce ufak bir şeye dikkat çekmek istiyorum. Genelde insanlar ortalama ifadesini kullandıkları zaman toplam miktarın toplam sayıya bölünmesi olarak anlıyorlar. Bu eksik bir anlayış. Ortalama birden fazla şekilde hesaplanabilir. Bu hesaplamalar İngilizcede Mean, Mode, ve Median olarak gösterilirler. Aslında bu makalenin konusu da ölçümleri hesaplama sırasında bunları da göz önünde bulundurmak, hatta kimi zamanlar Median ve Mode ortalamalarınını Mean ortalamasından daha mantıklı olabileceğini göstermek olacak.

Örnek

Diyelim ki web sayfanıza sırayla birden fazla istek yaptınız ve dönen her cevabın süresini kaydettiniz. Bu sürelerin aşağıda ki resimde gösterildiği gibi olduğunu düşünelim:

Mean

Yapılan isteklerin (request) tamamlanma süreleri saniye olarak 4, 2, 3, … şeklinde. Buradan bir ortalama almak suretiyle, genel olarak 4.44 saniye de sayfanızın cevap verdiğini söylüyorsunuz. Bu ilk bakışta mantıklı dursa da eksik bilgiler de içeriyor. Çünkü dağılım hakkında yeteri kadar bilgi vermiyor. Diyelim ki sizin kabul edilebilir olarak gördüğünüz request tamamlanma süresi 3 saniye olsun. Bu durumda mean ortalama sizi yanıltabilir. Çünkü cevap sürelerinde ki dağılımda ki bir kısım değerler 1 saniye diğer bir kısım ise 6 saniye olabilir ve sizin için bir kaç tane bile 6 saniye süren cevap tamamiyle kabul edilemez bir durum olabilir. Ama Mean ortalama bu bilgiyi göstermeyecektir.

Median

Bu durumda Median ortalama daha mantıklı olabilir. Median ortalama dağılımı küçükten büyüğe sıraladığınızda ortada ki değer olarak çıkar karşımıza. Yine yukarıda ki diagrama baktığımızda bunun verilen değerler için 5 olduğunu görürsünüz. Buradan değerlerin yarısının 5ten büyük, diğer yarısının ise 5ten küçük olduğu bilgisine ulaşırsınız. Eğer sizin için kabul edilebilir en büyük değer 5 ise, o zaman ortada ciddi bir sorunun varlığı daha bir gözle görülebilir halde gelecektir. Ama belki mean ortalama ile baksaydık, belkide bu değer 3 çıkacak ve bizi yanıltacaktı. Çünkü yüzlerce 4 ve 2 sayıları ile mean ortalama 3 çıkabilirdi.

Mode

Bazende Mode daha bir değerli olabilir. Mode ise bir dağılımda ki en çok tekrar eden değeri gösterir. Yine yukarıda ki örnekte bu 5 olarak karşımıza çıkmış oluyor. Yukarıda ki örnek için belki çok değerli bir veri olarak durmuyor olabilir ama bazı zamanlar bu ciddi bir mana taşıyabilir. Ama kullanıcıların en çok tecrübe ettikleri rakam 5 saniye olduğundan belki bu sizin ciddi bir sorundur.

Eğer Mean ortalama ile çalışıyorsanız, mean ortalamaya daha fazla değer katacak başka bir hesaplama ise Standard Sapmadır. Bunun bir formulü var. Google ederseniz çıkıyor. Ama kullanım yeri daha çok dağılımın nerede odaklandığını göstermek. Eğer standard sapma değeri yüksek çıkarsa, o zaman değerler daha çok başa ve sonra doğru fazlalık gösteriyor demek. Standard sapma düşük ise o zaman mean ortalamaya daha çok yakınlık gösteren bir dağılım görüyoruz demek. Neyse, bu da aklınızda bulunsun. Lazım olacaktır.

Bir sonra ki yazımda görüşmek üzere…

--

--