Nonparametric posthoc testleri

Aşağıdaki yazı akademik bir dil içermemekle birlikte akademik bir içeriğe sahiptir. Vakit yetersizliğinden Kaynakça belirtilmeden yazılmış olsa da kaynakçası bulunmaktadır. Yazının devamında tek faktörlü varyans analizinin varsayımları karşılanmadığında uygulanabilecek post-hoc testlerden z dağılımına dayalı olan bir tanesi anlatılmaktadır.

 

iki ya da daha çok grubun ortalamasını karşılaştırmak için yapılan tek faktörlü varyans analizinin (one-way anova), varsayımlarının karşılanmaması sonucu yapılamadığı durumlarda kullanılan, nonparametric alternatifi kruskal-wallis testi sonrası, bildirilmişse anlamlı farkın 3 ya da daha çok grubun hangileri arasından kaynaklandığını bulmak amacıyla kullanılan istatistiksel testlerdir.

cümlede sorun yok, anlaşılır durumda ama ben yine de de bir örnekle ne demeye çalıştığımı açayım:

varyans analizi (anova) olsun, onun parametrik olmayan alternatifi krukal-wallis olsun bu testler ikiden çok grup arasında anlamlı fark olup olmadığını bulmak amacıyla uygulanırlar. örneğin farklı sosyo-ekonomik düzeyden bireylerin zeka düzeyleri arasında anlamlı fark var mıdır? gibi soruları dert edindiğinizde imdada koşarlar. öyle ya, insaların farklı zenginlikte olmalarının tek sebebi ne olabilir. alt-sosyoekonomik düzeyin zekasında bir sorun olmalı, ortadakiler orta zekalı, üst sosyo-ekonomik düzeydekilerin ise zekası yüksek olmalıdır.

fakat acaba muhtemelen öylesine ortaya atılmış bu hipotez doğru mudur?

gidilir, alt-orta ve üst sosyoekonomik düzeylerden bireyler bulunur bunlara zeka testi uygulanır

veriler tanıdık bir istatistik paket programına girilir.

spss’te analyse—>compare means—>one-way anova yolundan gidilerek varyans analizi açılır.

gerekli değişkenler yerlerine atılır ve analiz yapılır.

o da ne

varyanslar homojen değil,

ya da

o da ne

her bir grupta zeka testi puanları normal dağılmıyor

ya da

o da ne

zeka testi eşit aralıklı ölçek düzeyinde bilgi vermiyor, milleti sadece sıraya diziyormuş

ya da

o da ne

bu üç gruptan hepsinde ya da bazılarında kişi sayıları varyans analizi yapmaya uygun olmayacak kadar küçük.

transformasyon da bir halta yaramadı, resmen köşeye sıkıştık diyecekken,

ne yapıyoruz.. daha bu sene 21 nisan’da kaybettiğimiz kruskal ve 1998’de kaybettiğimiz wallis abilerimizin bizlere hediyesi kruskal-wallis testini uyguluyoruz. bu test yukarıdaki durumlara karşı daha güçlü bir test olduğundan hiç korkmuyoruz uyguluyoruz.

bu sefer
analyse—>nonparametric tests—>k ındependent samples yolundan gidip uygun değişkenlerle analizimizi yapıyoruz.

diyelim ki analiz sonucunda 0,05’ten küçük bir anlamlılık değeri elde ediyoruz. yani ne demek, h1 hipotezinin, yani, “gruplar arasında zeka puanları bakımından anlamlı farklılık vardır” diyen hipotezin yanlış olma olasılığı %5’ten küçükmüş. ne demek bu, h1 büyük olasılıkla doğru demek, öyle değil mi,

değil mi? anlamadınız mı. bakın:

istatistikte, “varlık” iddiasında bulunan bir önermenin doğru kabul edilmesi için bu önermeden, kendisinin olmama olasılığını göstermesi istenir. denir ki

-sen varım diyorsun ama senin yok olma ya da hiç olmamış olma ihtimalin kaçtır.

-en fazla %5’tir komutanım

-demek ki senin gerçekten var olma ihtimalin var, bak senin olmamış olma ihtimalin eğer %5’ten fazla olsaydı sana inanmazdım, derdim ki bu çocuk varım diyor ama olmama ihtimali (örneğin) %36 (p=0,36) pek güven olmaz buna şimdi. yok sayalım gitsin.

fakat

kruskal-wallis bu testi geliştirirken çok şımarmayalım diye tüm özellikleri içine koymamışlar. 3 ya da daha çok grubu karşılaştırırken yaptığınız analiz sonucunda anlamlı fark bulursanız bu farkın hangi gruplar arasındaki farktan kaynaklandığını gösterecek bir özellik koymamışlar. yani sen fark buldun şimdi acaba alt-üst orta hepsi bunların birbirinden farklı olduğu için mi fark çıktı yoksa sadece alt ile üst arasında fark olduğu için mi fark çıktı. bilmiyoruz, bakacağız.

alt ile üst
alt ile orta
orta ile üst

grupları zeka puanları bakımından tek tek karşılaştıracağız. bu karşılaştırmayı yapmamıza yardımcı olan testlere, sonradan, sonraki, iş olup bittikten sonra anlamında post-hoc testler demişlerdir. bunların parametric olanlarının çoğu spss’te vardır, kolaylıkla kullanılabilirler. ama nonparametric olanları yoktur. nerededirler, r diye bir programdadırlar, ama r’yi kim bulacak şimdi.

bakalım bu nonparametric olanların isimleri nelermiş.

en ünlüleri nemenyi ve dunn’un geliştirdikleri, tukey’in parametrik karşılaştırmalar için önderdiği hsd testinin non-parametrik alternatifleridir.

nemenyi’nin yöntemi karşılaştırılacak tüm gruplardaki kişi sayıları eşit olduğunda kullanılır. formülü şudur:

1. grubun sıra ortalaması-2. grubun sıra ortalaması
q= —————————————————
karekök[n(kare)k(nk+1)/12]

n bir gruptaki kişi sayısı
k toplam grup sayısı

Elde edilen q değeri istatistikte studentized range q table denen bir tablo ile karşılaştırılır. Buyrun tablo burada https://www.stat.purdue.edu/~lingsong/teaching/2018fall/q-table.pdf 

Kaç grubunuz var, serbestlik dereceniz ne (toplam kişi sayısı – grup sayısı) bulun tablo q değerini, sizin hesapladığınız q bundan büyükse fark var demektir.

n’lerin eşit olmadığı durumda kullanılan dunn yöntemi ise

1. grubun sıra ortalaması-2. grubun sıra ortalaması
z= —————————————————
karekök[(n*(n+1)/12*(1/n1+1/n2)]

n toplam kişi sayısı
n1 1. gruptaki kişi sayısı
n2 2. gruptaki kişi sayısı

elde edilen z değeri analiz toplamda 0,05 düzeyinde yapıldıysa, bu 0,05 karşılaştırma sayısına bölünerek çıkan sonuç z tablosunda alan olarak bulunup karşsındaki z değeri kritik değer olarak alınır.

bu örnekte 0,05/3=0,0166

z tablosunda alan olarak 0,0166’ya karşılık gelen z değeri ise 2,13’tür. yukarıda hesaplayacağınız z değeri 2,13’ü geçerse karşılaştırdığınız gruplar arasında fark var demektir. bu işlemi 3 karşılaştırma için 3 defa tekrar edeceğinizi unutmayınız.


Yayımlandı

kategorisi

yazarı:

Etiketler:

Yorumlar

“Nonparametric posthoc testleri” için 2 yanıt

  1. Hasan Esen Rona avatarı
    Hasan Esen Rona

    Sayın Hocam, 19 Ağustos 2008 tarihli non-parametric posthoc testi adlı makalenizde Nemenyi ve Dunn testlerinden söz etmiştiniz.
    Her iki testi de Excel’de denedim; Dunn testinde Z değeri doğrudan hesaplanırken, Nemenyi testinde hesaplanan değerler sanki p-value değeri gibi elde ediliyor.
    Nerede yanılabileceğimi cevaplayabilirseniz sevinirim. Saygılarımla.

    1. Murat Akyıldız avatarı

      Hasan bey size geç yazdığım için çok üzgünüm. Umarım bu cevap sizi bulur. Nemenyi ve Dunn testlerinde hesapladığımız değerler farklı tablolardan karşılaştırılmalıdır. Yazıyı da sizin sorunuz doğrultusunda güncelledim. Nemenyi ile elde edilen değer istatistikte q tablosu denen bir tablo kullanılarak değerlendirilmelidir. Dunn testi yapılırsa z tablosu ile değerlendirilmelidir. O nedenle farklı sonuçlar bulmuştunuz. Ben yazının eski halinde Dunn için z’nin yorumunu vermiştim. Nemenyi için yorumlamayı anlatmamıştım. Şimdi kısmen güncelledim. Umuyorum ki yazıyı sıfırdan yazacak bir fırsat yakalayabilirim. Sizinle tanışmayı da çok isterim. istatistik@istatistik.gen.tr adresine iletişim bilgilerinizi gönderirseniz sizi aramak isterim. Selamlar,

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir