Bölüm 5 Betimsel İstatistikler: Merkezi Dağılım (Değişim) Ölçüleri

Betimleyici istatistiklerde merkezi eğilim ölçüleri hikâyenin yalnızca bir kısmıdır. Hikâyenin kalan kısmı ise merkezi dağılım ölçülerinden oluşmaktadır. Merkezi dağılım ölçüleri olan standart sapma, varyans ve ranj’a geçmeden önce değişkenlik kavramını tanımlamak yararlı olacaktır. Değişkenlik puanların birbirinden ne kadar farklı olduğudur (Salkind, 2011/2015). Daha iyi anlaşılması için şu örnek verilebilir. 4, 5, 1, 2, 8 dağılımı ile 3 3 3 3 8 dağılımının ortalamaları eşit olmasına rağmen puanların ortalamadan değişkenlikleri farklıdır.

Merkezi dağılım ölçüleri, dağılımın değişkenliği (yaygınlığı) hakkında bilgi vermektedir (Atılgan, 2017). Aritmetik ortalama puanların nerede yığıldığı göstermekte ancak puanların ne kadar yaygın olduğu diğer bir deyişle ortalamadan ne kadar uzaklaştıkları hakkında bilgi vermemektedir (Turgut ve Baykul, 2012). Bir dağılımda değerler ortalamadan uzaklaştıkça, o dağılımın yaygınlığı artar (Arıcı, 1997). Dağılımın yaygınlığıyla ilgili en önemli ölçü standart sapma ve bunun karesi olan varyanstır (Sümbüloğlu ve Sümbüloğlu, 2012). Şimdi merkezi dağılım ölçüsü olarak en sık kullanılan standart sapmayı öğrenelim.

5.1 Standart Sapma (Standart Kayma)

Standart sapma, bir dağılımdaki her bir değerin ortalamaya göre ne kadar uzaklıkta olduğu hakkında bilgi veren bir istatistiktir (Turgut ve Baykul, 2012). Diğer bir deyişle dağılımın ne kadar yaygınlığa sahip olduğunu gösteren bir ölçüdür (Arıcı, 1997). Standart sapma büyüdükçe dağılım yaygınlaşır (değişkenliği artar) (Sümbüloğlu ve Sümbüloğlu, 2012). Standart sapma, veri setindeki her bir puanın ortalamadan farkı alınarak hesaplanır. Denklem 3’te standart sapmanın denklemi verilmiştir (Arıcı, 1997).

\[ S_x=\sqrt{\frac{\sum_{i=1}^{n}\left(X_i-\bar{X}\right)^2}{n-1}} \]

Denklem 3’te \(X_{i}\), i. puanı, \(\overline{X}\), aritmetik ortalamayı, n ise toplam veri sayısını ifade etmektedir. Puanların ortalamadan farkı alındıktan sonra karesinin alınmasının sebebi negatif sayılardan kurtulmaktır (Atılgan, 2017). Çünkü ortalamadan sapmaların toplamı 0 olacaktır. Formülde son olarak karekök alınmaktadır bunun nedeni ise puanların ortalamalardan farkının karesini aldığımız için başa dönmektir (Salkind, 2011/2015). Yani sonucun karelerden oluşmasını istemiyoruz. Standart sapma, örneklemden elde edileceğinde n-1’e bölünmektedir. Evrenden elde edildiğinde ise N’e bölünmektedir (Arıcı, 1997). (Neden böyle olduğunu merak ediyorsanız: Link). Hızlı bir cevap vermek gerekirse örneklemden evrene tahmin yaptığımız ve tahminlerimizi yansız yapmak istediğimiz için n-1’e bölerek standart sapmayı elde ediyoruz diyebiliriz (Salkind, 2011/2015). Standart sapma farklı dağılımları karşılaştırmamızı sağlar. Standart sapmanın da uç değerlerden etkileneceği unutulmamalıdır. Tüm puanlar aynı olduğunda standart sapma 0 olacaktır (Salkind, 2011/2015).

5.2 Varyans

Standart sapmanın karesidir (Salkind, 2011/2015). Bir veri kümesinde, ölçme sonuçlarının ortalamadan farklarının karesinin ortalaması olarak ifade edilebilir (Turgut ve Baykul, 2012). Denklem 4’te varyans denklemi sunulmuştur.

\[ S_x^2=\frac{\sum_{i=1}^{n}\left(X_i-\bar{X}\right)^2}{n-1} \] Denklem 4 incelendiğinde varyansın, standart sapmanın karesi olduğu görülmektedir. Varyans da veri setindeki elemanların, ortalamadan ne kadar uzaklıkta olduğunun bir ölçüsüdür. Ancak standart sapma gibi elde edildiği birimlerle aynı birimde değildir (Atılgan, 2017). Karekök alma işlemi olmadığı için daha kolay hesaplanabilmektedir. Varyans pratik olduğu için tercih edilir ancak bilimsel çalışmalarda genellikle standart sapmaya yer verilir (Salkind, 2011/2015).

UYGULAMA İÇİN TIKLAYINIZ

Standart sapma ve varyans tek başına bir grubun dağılımı hakkında bilgi vermemektedir. Ancak iki grubun varyansı kıyaslanarak dağılımlar hakkında yorum yapılabilmektedir (Arıcı, 1997). Bu nedenle bağıl değişkenlik katsayısı (V) geliştirilmiştir.

5.3 Bağıl Değişkenlik Katsayısı (V)

Bağıl değişkenlik katsayısı, standart sapma ve ortalama yardımıyla hesaplanmaktadır. Denklem 5’te bağıl değişkenlik katsayısını hesaplamak için kullanılan denklem verilmiştir (Arıcı, 1997).

\[ V=\frac{S_x}{\bar{X}}.100 \]

Denklem 5’te \(S_{x}\) standart sapma, \(\bar{X}\) ise aritmetik ortalamadır. Bağıl değişkenlik katsayısının yorumlanması ise şu şekildedir (Uyar, 2019):

  • 20 ≤ V ≤ 25 \(\rightarrow\) Verilen dağılımı normaldir.
  • V > 25 \(\rightarrow\) Normalden basık dağılımı ifade eder. Grup heterojen, puanlar birbirinden uzaktır.
  • V < 20 \(\rightarrow\) Normdalden sivri dağılımı ifade eder. Grup homojen, puanlar birbirine yakındır.

Örneğin, standart sapması 5, aritmetik ortalaması 10 olan bir dağılımın V’sini bulalım:

\[ V=\frac{5}{10}.100=50 \]

Buna göre dağılımın normalden basık olduğu, grubun heterojen olduğu ve puanların birbirinden uzakta olduğu yorumu yapılabilir.

5.4 Ranj

Bir veri kümesinde en büyük ve en küçük veri arasındaki fark olarak tanımlanır (Turgut ve Baykul, 2012). Veri setinin ne kadar genişlikte yer aldığını gösterir (Salkind, 2011/2015). En genel değişkenlik ölçüsü olup puanların birbirinden en fazla ne kadar uzakta olduğunu gösterir (Uyar, 2019). Yayılımın genişliğini gösterse de puanların birbirinden ne kadar farklılaştığını göstermez (Salkind, 2011/2015).

\[ Ranj=X_{En Büyük}-X_{En Küçük} \]

ile hesaplanır.Örneğin 40 öğrencinin bir testten aldığı puanlar şöyle olsun:

1, 1, 0, 1, 2, 0, 3, 0, 4, 2, 4, 3, 4, 2, 5, 5, 1, 2, 0, 0, 0, 5, 1, 3, 1, 5, 1, 1, 0, 2, 5, 0, 4, 0, 0, 4, 2, 0, 1, 5

Buna göre bu ham puan dağılımının ranjı kaçtır?

\[ Ranj=X_{En Büyük}-X_{En Küçük}=5-0=5 \]

Ranj kaba bir istatistiktir (Arıcı, 1997). Çünkü uç değerlerden çok etkilenir (Atılgan, 2017). Ranj büyükse grubun heterojen, küçükse grubun homojen olduğunu söyleyebiliriz (Uyar, 2019). Ancak bu yorum veri setinde uç değer bulunmadığı durumlarda geçerli olacaktır. Standart sapma ve varyansın elle hesaplamasına kitapta yer verilmemiştir. Bu istatistiklerin Excel ve SPSS yazılımlarında nasıl elde edileceğiyle ilgili olarak uygulama linkindeki video incelenebilir.


UYGULAMA İÇİN TIKLAYINIZ