Saturday, June 22, 2019

Catatan Mengenai Uji Normalitas: Jangan Panik Jika Data Tidak Normal!


Pertanyaan yang paling sering disampaikan ke saya melalui website atau disampaikan secara langsung adalah: Data saya tidak normal, saya harus bagaimana Pak? Pertanyaan putus asa, seolah-olah usaha mengambil data dengan susah payah ini tidak ada hasilnya. Susah-susah mengumpulkan data sampai 500 orang, namun akhirnya harus menggunakan analisis non-parametrik hanya karena datanya tidak normal. Sebuah kemubaziran yang luar biasa. Dari seluruh artikel dan video yang saya buat, artikel cara mengatasi data berdistribusi tidak normal inilah yang paling laris dan banyak dikomentari orang yang mengalami nasib yang sama. Padahal alih-alih langsung mengatasi data tidak normal, kita harus paham dulu apa itu normalitas dan jenis-jenis uji normalitas. Tulisan ini akan memberikan beberapa catatan yang harus kita pahami terlebih dahulu sebelum menilai data kita normal atau tidak.

Secara umum, uji normalitas dapat dilakukan melalui tiga teknik: visual, skewness-kurtosis, dan uji statistik (Kolmogorov-Smirnov dan Shapiro-Wilk). Cara melakukan uji normalitas sendiri dapat dibaca di artikel ini. Dari ketiga teknik tersebut, masing-masing memliki kelebihan dan kekurangan. Berikut saya ulas satu per satu secara ringkas.
1.    Visual
Metode visual adalah dengan cara melihat histogram secara langsung. Data dapat dikatakan normal jika bentuknya seperti lonceng terbalik yang simetris, tidak terlalu gemuk dan tidak terlalu kurus. Contoh histogram dapat dilihat pada gambar di bawah.
Selain dengan menampilkan histogram, bisa juga dengan melihat P-P plot dan Q-Q Plot. Beberapa catatan mengenai metode visual adalah:
a. Penilaian normal/tidak cukup subjektif karena didasarkan penilaian pribadi terhadap bentuk visual
b.    Pada sampel kecil visual akan kasar, namun pada sampel besar visual akan lebih smooth sehingga penilaian bisa lebih baik
c. Dengan demikian metode ini cocok digunakan untuk menilai normalitas jika sampelnya besar

2.    Skewness-Kurtosis
Skewness menunjukkan seberapa menceng data kita, sementara Kurtosis menunjukkan seberapa gemuk bentuk distribusi data kita. Data yang ideal (normal) adalah yang tidak menceng serta tidak terlalu gemuk dan tidak terlalu kurus, oleh karenanya Skewness dan Kurtosisnya nol. Uji normalitas dengan Skewness dan Kurtosis dapat dilihat dengan menghitung nilai Zskewness dan Zkurtosis. Zskewness dapat dihitung dari nilai Skewness / SE Skewness. Begitu pula nilai Zkurtosis dapat dihitung dari nilai Kurtosis / SEKurtosis. Batas toleransi Zskewness dan Zkurtosis yang masih dianggap normal adalah antara -1,96 sd 1,96 (sering dibulatkan -2 sd 2). Beberapa catatan mengenai Skewness dan Kurtosis adalah:
a.    Menguji skewness dan Kurtosis artinya kita memastikan data kita tidak menceng berlebihan, serta tidak gemuk/kurus berlebihan
b.    Cocok digunakan pada sampel sedikit sampai sedang
c.    Jika sampel besar (lebih dari 200), SE akan cenderung kecil. Jika SE kecil, maka Zskewness dan Zkurtosis akan besar, dan hal ini akan diinterpretasikan sebagai data tidak normal. Hal ini cukup aneh karena semakin besar data seharusnya semakin mendekati normal.
d.    Field (2009) menyarankan jika sampel besar, uji normalitas cukup dilakukan dengan melihat nilai Skewness dan Kurtosisnya saja, tanpa membagi dengan standar errornya.

3.    Uji statistitik (Kolmogorov-Smirnov dan Shapiro-Wilk)
Uji statsitik dilakukan dengan membandingkan distribusi data kita dengan distribusi data normal idea; dengan mean dan SD yang sama. Jika test menunjukkan hasil signifikan (p<0,05), maka data kita tidak normal. Namun jika test menunjukkan hasil yang tidak signifikan (p>0,05), maka tidak ada perbedaan antara data kita dengan data normal idealnya, dengan kata lain data kita normal.
Kedua test ini juga memiliki beberapa catatan, diantaranya:
a.    Cocok digunakan pada jumlah sampel sedang
b. Pada sampel kecil, kecenderungannya test akan tidak signifikan yang diinterpretasikan data normal
c.   Pada sampel besar, kecenderungannya test akan signifikan yang diinterpretasikan data tidak normal
d.  Hal ini aneh karena sampel besar seharusnya lebih normal dibanding sampel kecil, namun jika menggunakan kedua test ini hasilnya justru kebalikannya. Oleh karena itu penggunaan Kolmogorov-Smirnov dan Shapiro-Wilk pada data sampel kecil (<30) dan sampel besar (>150) perlu diwaspadai karena hasilnya bisa jadi tidak valid.

Dari penjelasan di atas kita dapat simpulkan bahwa penggunaan uji normalitas dengan Skewness-Kurtosis serta dengan Kolmogorov-Smirnov / Shapiro-Wilk pada jumlah sampel besar sangat rawan bias dan hasilnya bisa jadi tidak valid. Kedua metode ini akan cenderung mengatakan data tidak normal pada sampel besar, padahal aslinya normal. Oleh karena itu jika subjek saya jumlahnya 300 orang, saya tidak akan menguji normalitas dengan Kolmogorov-Smirnov karena saya tahu data saya akan dinilai tidak normal. Saya juga tidak akan melihat nilai Zskewness dan Zkurtosis karena pasti juga tidak normal. Saya Jika jumlah sampel saya besar, saya bisa melihat nilai skewness dan kurtosis langsung atau mempertimbangkan uji normalitas dengan metode visual saja dengan melihat histogram, P-P Plot, atau Q-Q Plot.

Jadi tidak ada satu cara yang paling benar untuk menguji normalitas. Ketiga cara tersebut bisa saja digunakan sesuai dengan kondisi data yang kita miliki. Jika data kita tidak normal, pahami dulu data kita dan metode yang kita gunakan. Jangan-jangan kita salah memilih metode. Jika memang jumlah sampel saya 90 orang (sampel sedang) namun dengan ketiga cara tersebut data saya dinilai tidak normal, barulah saya mencoba cara-cara untuk menormalkan data dengan cara berikut.

Selain itu, ada beberapa kesalahpahaman tentang uji normalitas untuk analisis tertentu, seperti regresi. Analisis regresi sebenarnya tidak menghendaki data masing-masing variabel harus normal. Yang dikehendaki analisis regresi adalah residu dari analisis beberapa variabel tersebut terdistribusi secara normal. Pengertian ini tentu berbeda denga  uji normalitas yang sering dilakukan mahasiswa, yakni dengan menguji normalitas data mentah tiap variabel, padahal yang seharusnya diuji normalitasnya adalah residunya. Hal ini berlaku juga untuk analisis lain seperti SEM yang menghendaki normalitas multivariate, bukan normalitas untuk tiap variabel.

Penjelasan di atas sebenarnya juga masih terlepas dari beberapa kontroversi yang mempertanyakan apakah uji normalitas itu perlu dilakukan atau tidak. Beberapa ahli sebenarnya berpendapat bahwa uji normalitas itu adalah uji asumsi, bukan uji prasyarat. Asumsi tidak perlu diuji kecuali apabila ada kecurigaan bahwa satu atau lebih asumsi tidak terpenuhi. Beberapa juga berpendapat, bahwa jika sampel tidak normal maka efek kesalahan generalisasinya adalah kecil. Ada juga ahli yang mengatakan bahwa uji t dan uji F secara meyakinkan telah membuktikan diri sebagai statistik yang strong dan robust terhadap penyimpangan asumsi. Untuk penjelasan lebih lengkap mengenai pendapat para ahli tersebut dapat membaca tulisan lama Pak Azwar (2001) dan Pak Asmadi(2001) ini.

Jadi beberapa ahli sebenarnya menganggap uji normalitas itu tidak perlu. Nah jadi, dosen pembimbing kita menganut paham yang mana. Kalau memang menganggap uji normalitas itu perlu, ya berarti kita juga harus paham keterbatasannya. Namun kalau dosen pembimbing kita menganggap tidak perlu, ya berarti kita tidak usah repot-repot dengan semua ini.

Referensi
Field, A. P. (2009). Discovering statistics using SPSS: (and sex, drugs and rock “n” roll) (3rd ed). Los Angeles: SAGE Publications

Azwar, S. (2001). Asumsi-asumsi dalam inferensi statistika. Buletin Psikologi, Vol. 9(1), 8-17

Alsa, A. (2001). Kontroversi uji asumsi dalam statistik parametrik. Buletin Psikologi, Vol. 9(1), 18-22





7 comments:

  1. Selamat siang pak, boeleh kah saya minta email bapak, saya sedang menghadapi pengujian normalitas saya tidak normal, ada yang ingin saya tanyakan. Terimamasih sebelumnya pak

    ReplyDelete
  2. Saya mengalami ketidak normalan data, namun untuk uji lain sangat baik (uji t f dll). Responden. Saya berjumlah 204, apakah "pembiasan ini dikarenakan data yang terlalu bnyak? "
    Dengan uji 1s kolmogrov smirnov test

    ReplyDelete
  3. Assalamualaikum pak , saya sedang melakukan penelitian dan data yang peroleh tidak normal.namun ketika pake uji spss data saya normal. Bagaimana itu pak

    ReplyDelete
  4. Selamat siang, saya hendak bertanya terkait referensi yang menyebutkan jika data sampel besar (500) lebih baik menggunakan uji normalitas PP Plot.
    Apakah pernyataan ini dituliskan pada Field, AP(2009) ?

    Terimakasih

    ReplyDelete
  5. Thanks a lot for giving us such a helpful information. You can also visit our website for ignou handwritten assignment

    ReplyDelete
  6. Alhamdulillah terimakasih banyak pak infonya

    ReplyDelete