BÖLÜM4 Çok Gruplu Örtük Sınıf Analizi

Bazı durumlarda aynı özellikleri temsil eden örtük sınıfların genel popülasyonda veya o popülasyonun farklı tabakalarında eş zamanlı olarak nasıl dağılım gösterdiğini merak edebiliriz. Örneğin oy verme eğilimleri bakımından birbirleri ile benzer özellikler göstererek kümeleşen (örtük sınıf) grupların farklı eğitim düzeylerine göre bölünmüş tabakalarda nasıl kümelendikleri araştırma konusu olabilir. Benzer amaçlarla yapılacak araştırmalar için R’da “glca” kütüphanesini kullanabiliriz.

Bu tür bir modellemeye örnek için “glca” kütüphanesinden “gss08” veri setini çağıracağız. Bu veri seti 2008 yılında ABD’de uygulanan genel sosyal anketinde kürtajla ilgili ikili yanıtlanan (evet, hayır) sorulara 355 katılımcının verdiği yanıtlardan oluşmaktadır. Sorular kadınların hangi durumlarda kürtaj yaptırmasının yanıtlayıcı tarafından anlaşılır (meşru) olup olmadığını sorgulamaktadır. DEFECT maddesi bebekte ciddi bir hastalık olma ihtimali güçlüyse, HLTH maddesi kadının kendi sağlığı ciddi tehlike altındaysa, RAPE maddesi tecavüz sonucunda hamile kalındıysa, POOR maddesi aile yoksulsa, SINGLE maddesi kadın evli değilse, NOMORE maddesi başka çocuk istenmiyorsa durumlarında sizce kürtaj yapılabilir mi sorularının yanıtlarını içermektedir. Bu soruya verilecek yanıtlar farklı eğitim düzeylerine sahip topluluklarda farklılaşabilir ve bu farklılaşmalardan sınıf yapıları önemli ölçüde etkilenebilir. Bu bakımdan formülümüze grup değişkeni olarak bireylerin eğitim düzeylerini belirleyen DEGREE değişkenini ekliyoruz (group = DEGREE).

install.packages(“glca”) library(glca)

mglcr = glca(item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~ 1,
             group = DEGREE, data = gss08, nclass = 3, n.init = 1)
## Manifest items :
##  DEFECT HLTH RAPE POOR SINGLE NOMORE 
## Grouping variable : DEGREE 
## 
## Deleted observation(s) : 
## 3 observation(s) for missing all manifest items
## 0 observation(s) for missing at least 1 covariates
## 
## Multiple-group latent class analysis Fitting...
## 
##  84 iteration 
## 
## Converged at 84 iteration (loglik :-672.4138)

Kod Bloğu 11. Çok gruplu örtük sınıf analizi

Kod Bloğu 11’de kürtaj anketinde yer alan altı soru üzerinden üç örtük sınıfın keşfedilmesi istendi ve topluluk eğitim düzeylerine göre tabakalandırıldı. Kaç sınıflı modelin veriye daha iyi uyum sağlayacağı ile ilgili süreçler bu kitaptaki Bölüm 1 ve Bölüm 2’deki süreçler izlenerek uygulanabilir. Süreçlerin benzerliği bakımından söz konusu aşamalar bu bölümde tekrar ele alınmamıştır. R “glca” kütüphanesinin çok gruplu örtük sınıf analizi modelimize ortak değişken (covariate) eklenebilmesine de olanak tanıdığını belirtmek isteriz. Örneğin cinsiyet değişkeninin kürtajın sorgulandığı bir ankette örtük sınıfların keşfinde önemli rol oynayacağını öngörebiliriz ve etkisinin kontrol edilmesini isteyebiliriz. Kod Bloğu 13’te cinsiyet (SEX) değişkenini modele ekledik ve çıktıları aldık.

mglcr = glca(item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~ SEX,
             group = DEGREE, data = gss08, nclass = 3, n.init = 1)
## Manifest items :
##  DEFECT HLTH RAPE POOR SINGLE NOMORE 
## Grouping variable : DEGREE 
## Covariates (Level 1) : 
##  SEX 
## 
## Deleted observation(s) : 
## 3 observation(s) for missing all manifest items
## 0 observation(s) for missing at least 1 covariates
## 
## Multiple-group latent class analysis Fitting...
## 
##  95 iteration 
## 
## Converged at 95 iteration (loglik :-666.7097)
summary(mglcr)
## 
## Call:
## glca(formula = item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~ 
##     SEX, group = DEGREE, data = gss08, nclass = 3, n.init = 1)
## 
## Manifest items : DEFECT HLTH RAPE POOR SINGLE NOMORE 
## Grouping variable : DEGREE 
## Covariates (Level 1) : SEX 
## 
## Categories for manifest items :
##        Y = 1 Y = 2
## DEFECT   YES    NO
## HLTH     YES    NO
## RAPE     YES    NO
## POOR     YES    NO
## SINGLE   YES    NO
## NOMORE   YES    NO
## 
## Model : Multiple-group latent class analysis 
## 
## Number of latent classes : 3 
## Number of groups : 4 
## Number of observations : 352 
## Number of parameters : 28 
## 
## log-likelihood : -666.7097 
##      G-squared : 149.9656 
##            AIC : 1389.419 
##            BIC : 1497.601 
## 
## Marginal prevalences for latent classes :
## Class 1 Class 2 Class 3 
## 0.19860 0.46144 0.33996 
## 
## Class prevalences by group :
##             Class 1 Class 2 Class 3
## <= HS       0.32143 0.16848 0.51010
## HIGH SCHOOL 0.21275 0.44386 0.34339
## COLLEGE     0.15036 0.55347 0.29616
## GRADUATE    0.08580 0.71183 0.20237
## 
## Logistic regression coefficients :
## Group : <= HS 
##             Class 1/3 Class 2/3
## (Intercept)   -1.1445   -1.0634
## SEXFEMALE      1.0306   -0.0834
## 
## Group : HIGH SCHOOL 
##             Class 1/3 Class 2/3
## (Intercept)   -1.1261    0.2979
## SEXFEMALE      1.0306   -0.0834
## 
## Group : COLLEGE 
##             Class 1/3 Class 2/3
## (Intercept)   -1.3487    0.6686
## SEXFEMALE      1.0306   -0.0834
## 
## Group : GRADUATE 
##             Class 1/3 Class 2/3
## (Intercept)   -1.3620    1.2872
## SEXFEMALE      1.0306   -0.0834
## 
## Item-response probabilities (Y = 1) :
##         DEFECT   HLTH   RAPE   POOR SINGLE NOMORE
## Class 1 0.0649 0.3825 0.0989 0.0000 0.0000 0.0000
## Class 2 1.0000 1.0000 1.0000 0.9836 0.9309 0.9682
## Class 3 0.8342 0.9488 0.8086 0.0700 0.0440 0.1409
## 
## Item-response probabilities (Y = 2) :
##         DEFECT   HLTH   RAPE   POOR SINGLE NOMORE
## Class 1 0.9351 0.6175 0.9011 1.0000 1.0000 1.0000
## Class 2 0.0000 0.0000 0.0000 0.0164 0.0691 0.0318
## Class 3 0.1658 0.0512 0.1914 0.9300 0.9560 0.8591
coef(mglcr)
## Coefficients :
## 
## Class 1 / 3 :
##           Odds Ratio Coefficient  Std. Error  t value  Pr(>|t|)    
## SEXFEMALE    2.80287     1.03064     0.09971    10.34    <2e-16 ***
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Class 2 / 3 :
##           Odds Ratio Coefficient  Std. Error  t value  Pr(>|t|)
## SEXFEMALE    0.92003    -0.08335     0.06815   -1.223     0.222

Kod Bloğu 12. Çok gruplu ve ortak değişkenli örtük sınıf analizi

Sonuçlar incelendiğinde genel popülasyonda yaklaşık %20, %34 ve %46 büyüklüklerinde örtük sınıflar oluştuğunu (Marginal prevalences for latent classes) fakat bu örtük sınıfların büyüklüklerinin farklı eğitim düzeylerinde farklılaştığını görüyoruz. Sınıfların temsil ettikleri bakış açılarının belirlenmesinde madde yanıt olasılıklarının incelenmesi gerekmektedir. Çıktılarda yanıtlayıcıların hem evet seçeneğini işaretleme hem de hayır seçeneğini işaretleme olasılıklarını görebiliyoruz ve her ikisini de aynı amaçla kullanabiliriz. Farklı tabakalardaki ve örtük sınıflardaki bireylerin yanıt olasılıklarını daha kolay yorumlayabilmek ve böylece örtük sınıfları daha iyi tanımlayabilmek için görselleştirme işe yarayabilir.

plot(mglcr)

Şekil 6. Çok gruplu, ortak değişkenli üç sınıflı örtük sınıf analizi grafikler