BÖLÜM4 Çok Gruplu Örtük Sınıf Analizi
Bazı durumlarda aynı özellikleri temsil eden örtük sınıfların genel popülasyonda veya o popülasyonun farklı tabakalarında eş zamanlı olarak nasıl dağılım gösterdiğini merak edebiliriz. Örneğin oy verme eğilimleri bakımından birbirleri ile benzer özellikler göstererek kümeleşen (örtük sınıf) grupların farklı eğitim düzeylerine göre bölünmüş tabakalarda nasıl kümelendikleri araştırma konusu olabilir. Benzer amaçlarla yapılacak araştırmalar için R’da “glca” kütüphanesini kullanabiliriz.
Bu tür bir modellemeye örnek için “glca” kütüphanesinden “gss08” veri setini çağıracağız. Bu veri seti 2008 yılında ABD’de uygulanan genel sosyal anketinde kürtajla ilgili ikili yanıtlanan (evet, hayır) sorulara 355 katılımcının verdiği yanıtlardan oluşmaktadır. Sorular kadınların hangi durumlarda kürtaj yaptırmasının yanıtlayıcı tarafından anlaşılır (meşru) olup olmadığını sorgulamaktadır. DEFECT maddesi bebekte ciddi bir hastalık olma ihtimali güçlüyse, HLTH maddesi kadının kendi sağlığı ciddi tehlike altındaysa, RAPE maddesi tecavüz sonucunda hamile kalındıysa, POOR maddesi aile yoksulsa, SINGLE maddesi kadın evli değilse, NOMORE maddesi başka çocuk istenmiyorsa durumlarında sizce kürtaj yapılabilir mi sorularının yanıtlarını içermektedir. Bu soruya verilecek yanıtlar farklı eğitim düzeylerine sahip topluluklarda farklılaşabilir ve bu farklılaşmalardan sınıf yapıları önemli ölçüde etkilenebilir. Bu bakımdan formülümüze grup değişkeni olarak bireylerin eğitim düzeylerini belirleyen DEGREE değişkenini ekliyoruz (group = DEGREE).
install.packages(“glca”) library(glca)
mglcr = glca(item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~ 1,
group = DEGREE, data = gss08, nclass = 3, n.init = 1)
## Manifest items :
## DEFECT HLTH RAPE POOR SINGLE NOMORE
## Grouping variable : DEGREE
##
## Deleted observation(s) :
## 3 observation(s) for missing all manifest items
## 0 observation(s) for missing at least 1 covariates
##
## Multiple-group latent class analysis Fitting...
##
## 84 iteration
##
## Converged at 84 iteration (loglik :-672.4138)
Kod Bloğu 11. Çok gruplu örtük sınıf analizi
Kod Bloğu 11’de kürtaj anketinde yer alan altı soru üzerinden üç örtük sınıfın keşfedilmesi istendi ve topluluk eğitim düzeylerine göre tabakalandırıldı. Kaç sınıflı modelin veriye daha iyi uyum sağlayacağı ile ilgili süreçler bu kitaptaki Bölüm 1 ve Bölüm 2’deki süreçler izlenerek uygulanabilir. Süreçlerin benzerliği bakımından söz konusu aşamalar bu bölümde tekrar ele alınmamıştır. R “glca” kütüphanesinin çok gruplu örtük sınıf analizi modelimize ortak değişken (covariate) eklenebilmesine de olanak tanıdığını belirtmek isteriz. Örneğin cinsiyet değişkeninin kürtajın sorgulandığı bir ankette örtük sınıfların keşfinde önemli rol oynayacağını öngörebiliriz ve etkisinin kontrol edilmesini isteyebiliriz. Kod Bloğu 13’te cinsiyet (SEX) değişkenini modele ekledik ve çıktıları aldık.
mglcr = glca(item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~ SEX,
group = DEGREE, data = gss08, nclass = 3, n.init = 1)
## Manifest items :
## DEFECT HLTH RAPE POOR SINGLE NOMORE
## Grouping variable : DEGREE
## Covariates (Level 1) :
## SEX
##
## Deleted observation(s) :
## 3 observation(s) for missing all manifest items
## 0 observation(s) for missing at least 1 covariates
##
## Multiple-group latent class analysis Fitting...
##
## 95 iteration
##
## Converged at 95 iteration (loglik :-666.7097)
##
## Call:
## glca(formula = item(DEFECT, HLTH, RAPE, POOR, SINGLE, NOMORE) ~
## SEX, group = DEGREE, data = gss08, nclass = 3, n.init = 1)
##
## Manifest items : DEFECT HLTH RAPE POOR SINGLE NOMORE
## Grouping variable : DEGREE
## Covariates (Level 1) : SEX
##
## Categories for manifest items :
## Y = 1 Y = 2
## DEFECT YES NO
## HLTH YES NO
## RAPE YES NO
## POOR YES NO
## SINGLE YES NO
## NOMORE YES NO
##
## Model : Multiple-group latent class analysis
##
## Number of latent classes : 3
## Number of groups : 4
## Number of observations : 352
## Number of parameters : 28
##
## log-likelihood : -666.7097
## G-squared : 149.9656
## AIC : 1389.419
## BIC : 1497.601
##
## Marginal prevalences for latent classes :
## Class 1 Class 2 Class 3
## 0.19860 0.46144 0.33996
##
## Class prevalences by group :
## Class 1 Class 2 Class 3
## <= HS 0.32143 0.16848 0.51010
## HIGH SCHOOL 0.21275 0.44386 0.34339
## COLLEGE 0.15036 0.55347 0.29616
## GRADUATE 0.08580 0.71183 0.20237
##
## Logistic regression coefficients :
## Group : <= HS
## Class 1/3 Class 2/3
## (Intercept) -1.1445 -1.0634
## SEXFEMALE 1.0306 -0.0834
##
## Group : HIGH SCHOOL
## Class 1/3 Class 2/3
## (Intercept) -1.1261 0.2979
## SEXFEMALE 1.0306 -0.0834
##
## Group : COLLEGE
## Class 1/3 Class 2/3
## (Intercept) -1.3487 0.6686
## SEXFEMALE 1.0306 -0.0834
##
## Group : GRADUATE
## Class 1/3 Class 2/3
## (Intercept) -1.3620 1.2872
## SEXFEMALE 1.0306 -0.0834
##
## Item-response probabilities (Y = 1) :
## DEFECT HLTH RAPE POOR SINGLE NOMORE
## Class 1 0.0649 0.3825 0.0989 0.0000 0.0000 0.0000
## Class 2 1.0000 1.0000 1.0000 0.9836 0.9309 0.9682
## Class 3 0.8342 0.9488 0.8086 0.0700 0.0440 0.1409
##
## Item-response probabilities (Y = 2) :
## DEFECT HLTH RAPE POOR SINGLE NOMORE
## Class 1 0.9351 0.6175 0.9011 1.0000 1.0000 1.0000
## Class 2 0.0000 0.0000 0.0000 0.0164 0.0691 0.0318
## Class 3 0.1658 0.0512 0.1914 0.9300 0.9560 0.8591
## Coefficients :
##
## Class 1 / 3 :
## Odds Ratio Coefficient Std. Error t value Pr(>|t|)
## SEXFEMALE 2.80287 1.03064 0.09971 10.34 <2e-16 ***
## ---
## Signif. codes: 0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
##
## Class 2 / 3 :
## Odds Ratio Coefficient Std. Error t value Pr(>|t|)
## SEXFEMALE 0.92003 -0.08335 0.06815 -1.223 0.222
Kod Bloğu 12. Çok gruplu ve ortak değişkenli örtük sınıf analizi
Sonuçlar incelendiğinde genel popülasyonda yaklaşık %20, %34 ve %46 büyüklüklerinde örtük sınıflar oluştuğunu (Marginal prevalences for latent classes) fakat bu örtük sınıfların büyüklüklerinin farklı eğitim düzeylerinde farklılaştığını görüyoruz. Sınıfların temsil ettikleri bakış açılarının belirlenmesinde madde yanıt olasılıklarının incelenmesi gerekmektedir. Çıktılarda yanıtlayıcıların hem evet seçeneğini işaretleme hem de hayır seçeneğini işaretleme olasılıklarını görebiliyoruz ve her ikisini de aynı amaçla kullanabiliriz. Farklı tabakalardaki ve örtük sınıflardaki bireylerin yanıt olasılıklarını daha kolay yorumlayabilmek ve böylece örtük sınıfları daha iyi tanımlayabilmek için görselleştirme işe yarayabilir.
Şekil 6. Çok gruplu, ortak değişkenli üç sınıflı örtük sınıf analizi grafikler