Pada
tulisan sebelumnya telah dibahas
proses bootrapping dan kelebihannya. Salah satu kelebihan bootstrapping adalah
dapat melakukan analisis pada data yang tidak terdistribusi secara normal. Tulisan
ini akan memberikan ilustrasi bagaimana analisis bootsrapping ini dapat
dilakukan pada data yang tidak normal, sehingga menghasilkan estimasi yang
lebih cermat. Sebagaimana kita ketahui, statistik inferensial parametrik pada
umumnya menghendaki asumsi normalitas terpenuhi. Pelanggaran asumsi normalitas
yang cukup parah, apalagi jika jumlah sampel tidak cukup besar dapat
mengakibatkan nilai p yang diperoleh tidak akurat.
Di
bawah ini saya sajikan data fiktif mengenai tiga variabel, yaitu prestasi,
motivasi, dan IQ. Data dapat didownload di sini. Pada analisis kali ini, saya ingin mengetahui korelasi antar
ketiga variabel tersebut. Artinya saya akan menguji korelasi antara prestasi
dan motivasi, prestasi dan IQ, serta motivasi dan IQ. Analisis dilakukan dengan
korelasi Pearson. Meskipun di contoh ini saya hanya menyajikan analisis
korelasi saja, metode bootstrap dapat dilakukan untuk berbagai uji statistik
seperti korelasi, regresi, t-test, dan Anova.
Sebelum
saya lakukan analisis, saya lihat terlebih dahulu histogramnya untuk melihat
apakah data saya terdistribusi normal atau tidak. Analisis akan dilakukan
dengan SPSS. Untuk cara uji normalitas silakan lihat artikel ini. Histogram ketiga variabel ditunjukkan pada gambar di
bawah. Dari gambar di bawah terlihat bahwa variabel prestasi terdistribusi
secara tidak normal, sedangkan variabel motivasi dan IQ sudah normal.
Analisis korelasi Pearson
Meskipun
asumsi normalitas variabel prestasi tidak terpenuhi, namun saya akan mencoba
tetap melakukan analisis korelasi Pearson. Untuk cara analisis silakan lihat di
artikel ini. Setelah analisis
dilakukan, berikut adalah hasilnya.
Dari
output terlihat bahwa ketiga variabel saling berkorelasi secara signifikan (p
< 0,05), baik prestasi dengan motivasi (r = 0,304), prestasi dengan IQ (r =
287), dan motivasi dengan IQ (R= 384). Namun sebagaimana kita tahu dari uji
normalitas tadi, variabel prestasi mengalami penyimpangan asumsi normalitas
yang cukup parah. Sehingga nilai p yang dihasilkan masih perlu dipertanyatan. Sekarang
mari kita coba uji korelasi tersebut dengan metode bootstrapping.
Analisis korelasi Pearson
dengan boostrapping
Untuk
melakukan analisis korelasi dengan boostrapping, langkahnya kurang lebih sama,
klik analyze – correlate – bivariate,
dan masukkan ketiga variabel. Lalu klik boostrap..
maka akan muncul seperti ini.
Lalu
centang perform bootstrapping, dan
tentukan jumlah sampel kita. By default SPSS akan mengeluarkan 1.000, artinya
kita akan melakukan resample sejumlah 1.000 kali. Kita bisa meningkatkan angka
ini sehingga hasilnya bisa lebih akurat, namun sebagian besar ahli berpendapat
bahwa menaikkan sampel lebih sari 1.000 tidak akan berdampak besar. Semakin besar
sampel, semakin lama pula komputer akan melakukan komputasi. Untuk contoh kali
ini kita gunakan 1.000 sampel saja. Jika sudah klik continue dan OK. Output
dapat dilihat di bawah
Untuk
membaca hasil analisis dengan bootstrapping, kita cukup melihat pada baris yang
bertuliskan bootstrap. Hasil tersebut adalah hasil analisis boostrap dengan
1.000 sampel pada taraf kepercayaan 95%. Untuk melihat apakah korelasinya
signifikan atau tidak, kita lihat pada batas bawah (lower) dan batas atas
(upper). Lower dan upper merupakan rentang nilai r yang sesungguhnya dengan
taraf kepercayaan 95%. Misalkan, korelasi prestasi dan motivasi adalah r =
0,304; dan nilai sesungguhnya berada pada rentang antara -0,018 (lower) sampai
dengan 0,538 (upper). Dikarenakan dalam rentang tersebut mengandung nilai nol
yang berarti tidak ada hubungan, jadi dapat disimpulkan bahwa tidak ada
hubungan antara prestasi dan motivasi. Atau cara mudahnya, jika upper dan lower
berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama
memiliki nilai negatif maka korelasinya signifikan; namun sebaliknya jika upper
dan lower kutubnya berbeda, maka tidak signifikan.
Dari
output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak
berhubungan, begitu juga dengan prestasi dan IQ. Hasil ini berbeda dengan
analisis sebelumnya yang tanpa menggunakan boostrapping. Jika disuruh memilih,
kita akan menggunakan hasil yang mana? Tentu saja saya lebih percaya pada hasil
analisis dengan bootstrapping karena asumsi normalitas variabel prestasi tadi
tidak terpenuhi. Sementara jika kita menggunakan bootstrap, kita tidak
memerlukan asumsi normalitas. Jika kita lihat lebih lanjut pada korelasi antara
motivasi dengan IQ yang keduanya berdistribusi normal, baik menggunakan
analisis biasa ataupun dengan boostrapping menghasilkan hasil yang sama, yakni sama-sama
ada korelasi yang signifikan.
Saya melakukan analisis
boostrapping beberapa kali kok hasilnya berbeda?
Ya,
seringkali ketika kita melakukan bootstrapping, hasil nilai lower dan upper antar
satu analisis dengan analisis yang lain hasilnya berbeda. Mengapa demikian? Karena
komputer melakukan resample secara acak, jadi ada kemungkinan yang akan data
yang terambil juga berbeda. Sayangnya jika kita analisis dengan SPSS, kita
tidak bisa mengetahui hasil resample data kita. Namun perbedaan hasil itu
semakin kecil kemungkinannya jika kita menggunakan sampel bootstrapping yang
sangat besar, misal di atas 10.000. Namun kembali lagi, konsekuensi menggunakan
sampel yang besar adalah analisis yang memakan waktu cukup lama.