Hampir semua analisis statistika parametrik memiliki
asumsi normalitas. Jadi sebelum dilakukan analisis statistik, seperti analisis
korelasi, regresi, t-test, atau anova, terlebih dahulu harus diuji apakah data
kita normal atau tidak. Uji Normalitas dilakukan untuk memastikan data yang
telah dikumpulkan berdistribusi normal atau diambil dari populasi normal. Pada
dasarnya distribusi normal merupakan suatu distribusi yang menunjukkan sebaran
data yang seimbang yang sebagian besar data adalah mendekati nilai mean. Kalau
digambarkan dengan histrogram, akan menyerupai bentuk lonceng. Ada beberapa
cara untuk menguji normalitas data, baik itu dengan visual maupun dengan
analisis statistik seperti shapiro-wilk dan kolmogorov-smirnov.
Untuk memanggil kembali data kita seperti pada analisis sebelumnya, ketikkan kembali script setwd("C:/Users/Hanif/Google Drive/BLOGSPOT/UNTUK DIDOWNLOAD") dan perilakucsv<-read.csv("perilaku merokok.csv",header=TRUE,sep = ";") lalu kita run. Maka akan muncul data perilakucsv. Script silakan disesuaikan dengan nama file anda dan tempat menyimpan file tersebut. Jangan lupa untuk mengubah tanda back-slash (\) menjadi tanda slash (/) untuk menunjukkan lokasi file. Data ini yang akan kita gunakan di analisis selanjutnya. Data dapat didownload di sini
Uji Normalitas
dengan Visual
Ada beberapa metode visual yang bisa dipakai untuk
menguji normalitas. Seperti dengan Q-Q plot, boxplot, dan histogram.
Q-Q plot
Misalkan kita ingin melihat apakah variabel sikap
terdistribusi normal atau tidak, kita bisa masukan script qqnorm(perilakucsv$SIKAP), kemudian run. Untuk menampilkan
garis normal, masukan script qqline(perilakucsv$SIKAP), lalu run. Maka akan muncul
tampilan seperti ini di bagian kotak plot.
Gambar tersebut menampilkan penyimpangan data dari
normal. Semakin sedikit titik yang menjauhi garis, berarti data semakin normal.
Dilihat dari gambar tersebut, sekilas terlihat bahwa data mendekati garis
normal.
Boxplot
Boxplot digunakan melihat apakah data terbagi secara
simetris, median tepat di tengah, serta tidak ada outlier atau nilai ekstrim. Misalkan
kita ingin melihat boxplot variabel sikap, maka masukan script boxplot(perilakucsv$SIKAP), lalu run. Kita dapat melihat
output seperti ini.
Dari gambar di atas sekilas terlihat bahwa data simetris.
Namun terlihat bahwa ada outlier yakni ada responden yang memiliki nilai
ekstrem rendah.
Histogram
Cara paling umum dilakukan untuk melihat normalitas data
adalah dengan melihat histogram. Histogram merupakan distribusi frekuensi skor.
Untuk menampilkan histogran, masukan script hist(perilakucsv$SIKAP), lalu run. Maka akan
diperoleh output seperti ini.
Dari gambar di atas telihat sekilas data berdistribusi
normal. Data yang mendekati nilai mean berjumlah banyak dan berangsur menurun
semakin menjauhi mean. Dari gambar juga terlihat ada responden yang memiliki
nilai ekrem rendah. Hal ini seperti yang ditunjukan pada boxplot.
Cara-cara tadi adalah melihat normalitas data secara
visual. Perlu diperhatikan bahwa cara ini hanya tepat untuk langkah awal saja,
apakah data mengikuti distribusi normal atau tidak. Melihat normalitas secara
visual saja rawan terjadi bias, oleh karena itu dalam penelitian biasanya
dilakukan uji normalitas secara statistik dengan kolmogorov-smirnov atau dengan
shapiro-wilk.
Uji Normalitas
dengan Shapiro-Wilk
Cara paling umum dilakukan untuk melihat normalitas dalam
skripsi mahasiswa adalah dengan kolmogorov-smirnov. Uji kolmogorov smirnov
memanglah uji yang paling umum, namun uji tersebut mempunyai sedikit kelemahan,
yaitu cocok pada pengujian dengan sampel besar > 200. Selain itu, uji
kolmogorov smirnov juga tidak bisa dilakukan untuk menguji normalitas pada
RStudio. Cara lain untuk uji normalitas adalah dengan shapiro-wilk. Untuk melihat
apakah variabel sikap terdistribusi secara normal atau tidak, masukan script shapiro.test(perilakucsv$SIKAP),
lalu run. Maka akan terlihat output seperti ini.
Shapiro-wilk mencocokan apakah data kita menyimpang dari
data normal. Jika nilai p<0,01 maka, dapat dikatakan ada perbedaan antara
data kita dengan data normal. Namun jika p>0,05 berarti tidak ada perbedaan
antara data kita dengan data normal. Dari output di atas, nilai p=0,26
(p>0,05) yang menunjukkan tidak ada perbedaan antara data kita dengan data
normal. Hal ini berarti data kita terdistribusi secara normal.
permisi ingin bertanya kalimat "Uji kolmogorov smirnov memanglah uji yang paling umum, namun uji tersebut mempunyai sedikit kelemahan, yaitu cocok pada pengujian dengan sampel besar > 200." ini landasanya apa atau sumbernya dari mana ya?
ReplyDeletemohon dijawab karena untuk tugas kuliah. terima kasih
https://www.semestapsikometrika.com/2019/06/catatan-mengenai-uji-normalitas-jangan.html
Deletemohon maaf, uji kolmogorov smirnov bisa dilakukan untuk menguji normalitas pada RStudio. dengan syntax ks.test()
ReplyDelete