Pertanyaan yang paling sering disampaikan ke saya melalui
website atau disampaikan secara langsung adalah: Data saya tidak normal, saya
harus bagaimana Pak? Pertanyaan putus asa, seolah-olah usaha mengambil data
dengan susah payah ini tidak ada hasilnya. Susah-susah mengumpulkan data sampai
500 orang, namun akhirnya harus menggunakan analisis non-parametrik hanya
karena datanya tidak normal. Sebuah kemubaziran yang luar biasa. Dari seluruh
artikel dan video yang saya buat, artikel cara mengatasi data berdistribusi tidak normal inilah yang paling laris dan
banyak dikomentari orang yang mengalami nasib yang sama. Padahal alih-alih
langsung mengatasi data tidak normal, kita harus paham dulu apa itu normalitas
dan jenis-jenis uji normalitas. Tulisan ini akan memberikan beberapa catatan
yang harus kita pahami terlebih dahulu sebelum menilai data kita normal atau
tidak.
Secara umum, uji normalitas dapat dilakukan melalui tiga
teknik: visual, skewness-kurtosis, dan uji statistik (Kolmogorov-Smirnov dan
Shapiro-Wilk). Cara melakukan uji normalitas sendiri dapat dibaca di artikel ini. Dari ketiga teknik tersebut,
masing-masing memliki kelebihan dan kekurangan. Berikut saya ulas satu per satu
secara ringkas.
1.
Visual
Metode visual adalah dengan cara melihat histogram secara
langsung. Data dapat dikatakan normal jika bentuknya seperti lonceng terbalik
yang simetris, tidak terlalu gemuk dan tidak terlalu kurus. Contoh histogram
dapat dilihat pada gambar di bawah.
Selain dengan menampilkan histogram, bisa juga dengan
melihat P-P plot dan Q-Q Plot. Beberapa catatan mengenai metode visual adalah:
a. Penilaian normal/tidak cukup subjektif karena didasarkan
penilaian pribadi terhadap bentuk visual
b. Pada sampel kecil visual akan kasar, namun pada sampel besar visual akan lebih smooth sehingga penilaian bisa lebih baik
b. Pada sampel kecil visual akan kasar, namun pada sampel besar visual akan lebih smooth sehingga penilaian bisa lebih baik
c. Dengan demikian metode ini cocok digunakan untuk menilai
normalitas jika sampelnya besar
2.
Skewness-Kurtosis
Skewness menunjukkan seberapa menceng data kita,
sementara Kurtosis menunjukkan seberapa gemuk bentuk distribusi data kita. Data
yang ideal (normal) adalah yang tidak menceng serta tidak terlalu gemuk dan
tidak terlalu kurus, oleh karenanya Skewness dan Kurtosisnya nol. Uji
normalitas dengan Skewness dan Kurtosis dapat dilihat dengan menghitung nilai Zskewness
dan Zkurtosis. Zskewness dapat
dihitung dari nilai Skewness / SE Skewness.
Begitu pula nilai Zkurtosis dapat
dihitung dari nilai Kurtosis / SEKurtosis.
Batas toleransi Zskewness dan Zkurtosis yang masih dianggap normal adalah
antara -1,96 sd 1,96 (sering dibulatkan -2 sd 2). Beberapa catatan mengenai Skewness
dan Kurtosis adalah:
a.
Menguji skewness dan Kurtosis artinya kita memastikan
data kita tidak menceng berlebihan, serta tidak gemuk/kurus berlebihan
b.
Cocok digunakan pada sampel sedikit sampai sedang
c.
Jika sampel besar (lebih dari 200), SE akan cenderung
kecil. Jika SE kecil, maka Zskewness dan Zkurtosis akan besar, dan hal ini akan
diinterpretasikan sebagai data tidak normal. Hal ini cukup aneh karena semakin
besar data seharusnya semakin mendekati normal.
d.
Field (2009) menyarankan jika sampel besar, uji
normalitas cukup dilakukan dengan melihat nilai Skewness dan Kurtosisnya saja,
tanpa membagi dengan standar errornya.
3.
Uji statistitik (Kolmogorov-Smirnov dan Shapiro-Wilk)
Uji statsitik dilakukan dengan membandingkan distribusi data kita dengan
distribusi data normal idea; dengan mean dan SD yang sama. Jika test menunjukkan
hasil signifikan (p<0,05), maka data kita tidak normal. Namun jika test
menunjukkan hasil yang tidak signifikan (p>0,05), maka tidak ada perbedaan
antara data kita dengan data normal idealnya, dengan kata lain data kita
normal.
Kedua test ini juga memiliki beberapa catatan,
diantaranya:
a.
Cocok digunakan pada jumlah sampel sedang
b. Pada sampel kecil, kecenderungannya test akan tidak
signifikan yang diinterpretasikan data normal
c. Pada sampel besar, kecenderungannya test akan signifikan
yang diinterpretasikan data tidak normal
d. Hal ini aneh karena sampel besar seharusnya lebih normal
dibanding sampel kecil, namun jika menggunakan kedua test ini hasilnya justru
kebalikannya. Oleh karena itu penggunaan Kolmogorov-Smirnov dan Shapiro-Wilk
pada data sampel kecil (<30) dan sampel besar (>150) perlu diwaspadai
karena hasilnya bisa jadi tidak valid.
Dari penjelasan di atas kita dapat simpulkan bahwa
penggunaan uji normalitas dengan Skewness-Kurtosis serta dengan
Kolmogorov-Smirnov / Shapiro-Wilk pada jumlah sampel besar sangat rawan bias
dan hasilnya bisa jadi tidak valid. Kedua metode ini akan cenderung mengatakan
data tidak normal pada sampel besar, padahal aslinya normal. Oleh karena itu
jika subjek saya jumlahnya 300 orang, saya tidak akan menguji normalitas dengan
Kolmogorov-Smirnov karena saya tahu data saya akan dinilai tidak normal. Saya
juga tidak akan melihat nilai Zskewness dan Zkurtosis karena pasti juga tidak
normal. Saya Jika jumlah sampel saya besar, saya bisa melihat nilai skewness
dan kurtosis langsung atau mempertimbangkan uji normalitas dengan metode visual
saja dengan melihat histogram, P-P Plot, atau Q-Q Plot.
Jadi tidak ada satu cara yang paling benar untuk menguji
normalitas. Ketiga cara tersebut bisa saja digunakan sesuai dengan kondisi data
yang kita miliki. Jika data kita tidak normal, pahami dulu data kita dan metode
yang kita gunakan. Jangan-jangan kita salah memilih metode. Jika memang jumlah sampel
saya 90 orang (sampel sedang) namun dengan ketiga cara tersebut data saya
dinilai tidak normal, barulah saya mencoba cara-cara untuk menormalkan data
dengan cara berikut.
Selain itu, ada beberapa kesalahpahaman tentang uji normalitas untuk analisis tertentu, seperti regresi. Analisis regresi sebenarnya tidak menghendaki data masing-masing variabel harus normal. Yang dikehendaki analisis regresi adalah residu dari analisis beberapa variabel tersebut terdistribusi secara normal. Pengertian ini tentu berbeda denga uji normalitas yang sering dilakukan mahasiswa, yakni dengan menguji normalitas data mentah tiap variabel, padahal yang seharusnya diuji normalitasnya adalah residunya. Hal ini berlaku juga untuk analisis lain seperti SEM yang menghendaki normalitas multivariate, bukan normalitas untuk tiap variabel.
Penjelasan di atas sebenarnya juga masih terlepas dari beberapa kontroversi yang mempertanyakan apakah uji normalitas itu perlu dilakukan atau tidak. Beberapa ahli sebenarnya berpendapat bahwa uji normalitas itu adalah uji asumsi, bukan uji prasyarat. Asumsi tidak perlu diuji kecuali apabila ada kecurigaan bahwa satu atau lebih asumsi tidak terpenuhi. Beberapa juga berpendapat, bahwa jika sampel tidak normal maka efek kesalahan generalisasinya adalah kecil. Ada juga ahli yang mengatakan bahwa uji t dan uji F secara meyakinkan telah membuktikan diri sebagai statistik yang strong dan robust terhadap penyimpangan asumsi. Untuk penjelasan lebih lengkap mengenai pendapat para ahli tersebut dapat membaca tulisan lama Pak Azwar (2001) dan Pak Asmadi(2001) ini.
Penjelasan di atas sebenarnya juga masih terlepas dari beberapa kontroversi yang mempertanyakan apakah uji normalitas itu perlu dilakukan atau tidak. Beberapa ahli sebenarnya berpendapat bahwa uji normalitas itu adalah uji asumsi, bukan uji prasyarat. Asumsi tidak perlu diuji kecuali apabila ada kecurigaan bahwa satu atau lebih asumsi tidak terpenuhi. Beberapa juga berpendapat, bahwa jika sampel tidak normal maka efek kesalahan generalisasinya adalah kecil. Ada juga ahli yang mengatakan bahwa uji t dan uji F secara meyakinkan telah membuktikan diri sebagai statistik yang strong dan robust terhadap penyimpangan asumsi. Untuk penjelasan lebih lengkap mengenai pendapat para ahli tersebut dapat membaca tulisan lama Pak Azwar (2001) dan Pak Asmadi(2001) ini.
Jadi beberapa ahli sebenarnya menganggap uji normalitas
itu tidak perlu. Nah jadi, dosen pembimbing kita menganut paham yang mana. Kalau
memang menganggap uji normalitas itu perlu, ya berarti kita juga harus paham
keterbatasannya. Namun kalau dosen pembimbing kita menganggap tidak perlu, ya
berarti kita tidak usah repot-repot dengan semua ini.
Referensi
Field, A. P. (2009). Discovering statistics using SPSS: (and sex, drugs and rock “n”
roll) (3rd ed). Los
Angeles: SAGE Publications
Azwar, S. (2001). Asumsi-asumsi dalam inferensi statistika. Buletin Psikologi, Vol. 9(1), 8-17
Alsa, A. (2001). Kontroversi uji asumsi dalam statistik parametrik. Buletin Psikologi, Vol. 9(1), 18-22
Selamat siang pak, boeleh kah saya minta email bapak, saya sedang menghadapi pengujian normalitas saya tidak normal, ada yang ingin saya tanyakan. Terimamasih sebelumnya pak
ReplyDeleteSaya mengalami ketidak normalan data, namun untuk uji lain sangat baik (uji t f dll). Responden. Saya berjumlah 204, apakah "pembiasan ini dikarenakan data yang terlalu bnyak? "
ReplyDeleteDengan uji 1s kolmogrov smirnov test
Assalamualaikum pak , saya sedang melakukan penelitian dan data yang peroleh tidak normal.namun ketika pake uji spss data saya normal. Bagaimana itu pak
ReplyDeleteterima kasih atas masukannya
ReplyDeleteSelamat siang, saya hendak bertanya terkait referensi yang menyebutkan jika data sampel besar (500) lebih baik menggunakan uji normalitas PP Plot.
ReplyDeleteApakah pernyataan ini dituliskan pada Field, AP(2009) ?
Terimakasih
Thanks a lot for giving us such a helpful information. You can also visit our website for ignou handwritten assignment
ReplyDeleteAlhamdulillah terimakasih banyak pak infonya
ReplyDelete