Sunday, March 1, 2020

Analisis Data yang Tidak Berdistribusi Normal dengan Bootstrapping di SPSS


Pada tulisan sebelumnya telah dibahas proses bootrapping dan kelebihannya. Salah satu kelebihan bootstrapping adalah dapat melakukan analisis pada data yang tidak terdistribusi secara normal. Tulisan ini akan memberikan ilustrasi bagaimana analisis bootsrapping ini dapat dilakukan pada data yang tidak normal, sehingga menghasilkan estimasi yang lebih cermat. Sebagaimana kita ketahui, statistik inferensial parametrik pada umumnya menghendaki asumsi normalitas terpenuhi. Pelanggaran asumsi normalitas yang cukup parah, apalagi jika jumlah sampel tidak cukup besar dapat mengakibatkan nilai p yang diperoleh tidak akurat.

Di bawah ini saya sajikan data fiktif mengenai tiga variabel, yaitu prestasi, motivasi, dan IQ. Data dapat didownload di sini. Pada analisis kali ini, saya ingin mengetahui korelasi antar ketiga variabel tersebut. Artinya saya akan menguji korelasi antara prestasi dan motivasi, prestasi dan IQ, serta motivasi dan IQ. Analisis dilakukan dengan korelasi Pearson. Meskipun di contoh ini saya hanya menyajikan analisis korelasi saja, metode bootstrap dapat dilakukan untuk berbagai uji statistik seperti korelasi, regresi, t-test, dan Anova.

Sebelum saya lakukan analisis, saya lihat terlebih dahulu histogramnya untuk melihat apakah data saya terdistribusi normal atau tidak. Analisis akan dilakukan dengan SPSS. Untuk cara uji normalitas silakan lihat artikel ini. Histogram ketiga variabel ditunjukkan pada gambar di bawah. Dari gambar di bawah terlihat bahwa variabel prestasi terdistribusi secara tidak normal, sedangkan variabel motivasi dan IQ sudah normal.

Analisis korelasi Pearson
Meskipun asumsi normalitas variabel prestasi tidak terpenuhi, namun saya akan mencoba tetap melakukan analisis korelasi Pearson. Untuk cara analisis silakan lihat di artikel ini. Setelah analisis dilakukan, berikut adalah hasilnya.
Dari output terlihat bahwa ketiga variabel saling berkorelasi secara signifikan (p < 0,05), baik prestasi dengan motivasi (r = 0,304), prestasi dengan IQ (r = 287), dan motivasi dengan IQ (R= 384). Namun sebagaimana kita tahu dari uji normalitas tadi, variabel prestasi mengalami penyimpangan asumsi normalitas yang cukup parah. Sehingga nilai p yang dihasilkan masih perlu dipertanyatan. Sekarang mari kita coba uji korelasi tersebut dengan metode bootstrapping.

Analisis korelasi Pearson dengan boostrapping
Untuk melakukan analisis korelasi dengan boostrapping, langkahnya kurang lebih sama, klik analyze – correlate – bivariate, dan masukkan ketiga variabel. Lalu klik boostrap.. maka akan muncul seperti ini.
Lalu centang perform bootstrapping, dan tentukan jumlah sampel kita. By default SPSS akan mengeluarkan 1.000, artinya kita akan melakukan resample sejumlah 1.000 kali. Kita bisa meningkatkan angka ini sehingga hasilnya bisa lebih akurat, namun sebagian besar ahli berpendapat bahwa menaikkan sampel lebih sari 1.000 tidak akan berdampak besar. Semakin besar sampel, semakin lama pula komputer akan melakukan komputasi. Untuk contoh kali ini kita gunakan 1.000 sampel saja. Jika sudah klik continue dan OK. Output dapat dilihat di bawah
Untuk membaca hasil analisis dengan bootstrapping, kita cukup melihat pada baris yang bertuliskan bootstrap. Hasil tersebut adalah hasil analisis boostrap dengan 1.000 sampel pada taraf kepercayaan 95%. Untuk melihat apakah korelasinya signifikan atau tidak, kita lihat pada batas bawah (lower) dan batas atas (upper). Lower dan upper merupakan rentang nilai r yang sesungguhnya dengan taraf kepercayaan 95%. Misalkan, korelasi prestasi dan motivasi adalah r = 0,304; dan nilai sesungguhnya berada pada rentang antara -0,018 (lower) sampai dengan 0,538 (upper). Dikarenakan dalam rentang tersebut mengandung nilai nol yang berarti tidak ada hubungan, jadi dapat disimpulkan bahwa tidak ada hubungan antara prestasi dan motivasi. Atau cara mudahnya, jika upper dan lower berada pada satu kutub yang sama, misal sama-sama memiliki nilai positif atau sama-sama memiliki nilai negatif maka korelasinya signifikan; namun sebaliknya jika upper dan lower kutubnya berbeda, maka tidak signifikan.

Dari output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak berhubungan, begitu juga dengan prestasi dan IQ. Hasil ini berbeda dengan analisis sebelumnya yang tanpa menggunakan boostrapping. Jika disuruh memilih, kita akan menggunakan hasil yang mana? Tentu saja saya lebih percaya pada hasil analisis dengan bootstrapping karena asumsi normalitas variabel prestasi tadi tidak terpenuhi. Sementara jika kita menggunakan bootstrap, kita tidak memerlukan asumsi normalitas. Jika kita lihat lebih lanjut pada korelasi antara motivasi dengan IQ yang keduanya berdistribusi normal, baik menggunakan analisis biasa ataupun dengan boostrapping menghasilkan hasil yang sama, yakni sama-sama ada korelasi yang signifikan.

Saya melakukan analisis boostrapping beberapa kali kok hasilnya berbeda?  
Ya, seringkali ketika kita melakukan bootstrapping, hasil nilai lower dan upper antar satu analisis dengan analisis yang lain hasilnya berbeda. Mengapa demikian? Karena komputer melakukan resample secara acak, jadi ada kemungkinan yang akan data yang terambil juga berbeda. Sayangnya jika kita analisis dengan SPSS, kita tidak bisa mengetahui hasil resample data kita. Namun perbedaan hasil itu semakin kecil kemungkinannya jika kita menggunakan sampel bootstrapping yang sangat besar, misal di atas 10.000. Namun kembali lagi, konsekuensi menggunakan sampel yang besar adalah analisis yang memakan waktu cukup lama.

36 comments:

  1. saya coba praktekkan dengan data fiktif yang disajikan pada tulisan ini via spss 25... tapi hasil boostrap nya tidak keluar pada hasil output spss... why? mohon pencerahannya...

    ReplyDelete
    Replies
    1. Apakah perform bootstrapnya sudah dicentang? Jika sudah dan tidak keluar, moaaf saya juga kurang tahu kenapa

      Delete
    2. Mohon maaf mas Hanif, ditempat saya juga tidak keluar hasil analisi boostrapnya. Ataukah mungkin versi SPSSnya yang kurang mendukung

      Delete
    3. Izin bertanya, kenapa harus menggunakan bootsrap 1000? Apakah ada landasan atau pernyataan ilmiah mengenai hal ini.

      Delete
  2. I’m excited to uncover this page. I need to to thank you for ones time for this particularly fantastic read!! I definitely really liked every part of it and i also have you saved to fav to look at new information in your site.
    data science course
    360DigiTMG

    ReplyDelete
  3. This comment has been removed by the author.

    ReplyDelete
  4. halo. ingin request materi tentang
    - penafsir parameter
    - ketidakbiasan
    - macam2 distribusi peluang

    ReplyDelete
  5. Great post i must say and thanks for the information. Education is definitely a sticky subject. However, is still among the leading topics of our time. I appreciate your post and look forward to more.
    PMP Certification in Malaysia


    PMP Certification


    360DigiTMG

    ReplyDelete
  6. Kalau regresi linier cara baca hasil boostsrap nya gimana mas, dilihat dari nilai lower-upper nya juga kah

    ReplyDelete
  7. You actually make it look so easy with your performance but I find this matter to be actually something which I think I would never comprehend. It seems too complicated and extremely broad for me. I'm looking forward for your next post, I’ll try to get the hang of it!
    360DigiTMG PMP Certification
    360DigiTMG PMP Course
    360DigiTMG PMP Course in Malaysia
    360DigiTMG PMP Training in Malaysia
    360DigiTMG PMP Training

    ReplyDelete
  8. Great post i must say and thanks for the information. Education is definitely a sticky subject. However, is still among the leading topics of our time. I appreciate your post and look forward to more. PMP Certification 360DigiTMG
    PMP Course 360DigiTMG
    PMP Course in Malaysia 360DigiTMG
    PMP Training in Malaysia 360DigiTMG
    PMP Training 360DigiTMG

    ReplyDelete
  9. Simply the manner in which I have anticipated. Your site truly is intriguing.
    training provider in malaysia

    ReplyDelete

  10. This site is astounding data and realities it's truly fantastic
    "
    hrdf claimable courses"

    ReplyDelete
  11. I would recommend my profile is important to me, I invite you to discuss this topic...
    best institutes for digital marketing in hyderabad

    ReplyDelete
  12. This comment has been removed by the author.

    ReplyDelete
  13. Assalamualaikum. Ditulis:

    1) "Misalkan, korelasi prestasi dan motivasi adalah r = 0,304; dan nilai sesungguhnya
    berada pada rentang antara -0,018 (lower) sampai dengan 0,538 (upper)".

    Pada jadual, korelasi prestasi dan motivasi: nilai r adalah jelas iaitu 0.304. Bagaimnana tuan beroleh nilai -0.018 (lower) sampai 0.538 (upper)? Bukankah nilainya adalah 0.005 (lower) dan 0.573 (upper)?

    2) "Dari output tersebut kita tahu bahwa sesungguhnya antara prestasi dan motivasi tidak
    berhubungan, begitu juga dengan prestasi dan IQ."
    "Atau cara mudahnya, jika upper dan lower berada pada satu kutub yang sama, misal sama-
    sama memiliki nilai positif atau sama-sama memiliki nilai negatif maka korelasinya
    signifikan; namun sebaliknya jika upper dan lower kutubnya berbeda, maka tidak
    signifikan."

    Persoalannya bagaimana dikatakan antara prestasi dan motivasi tidak berhubungan,
    begitu juga dengan prestasi dan IQ? Jika dilihat dalam jadual, nilai upper dan lower bagi kedua-dua perkara (prestasi dan motivasi serta prestasi dan IQ) masing-masing adalah kedua-duanya bernilai positif (mempunyai kutub yang sama).Tidakkah kedua-dua perkara mempunyai korelasi yang signifikan?

    Mohon pencerahan daripada tuan. Saya agak keliru bila membaca penyataan yang telah
    diberikan. Terima kasih dan Jazakallah.

    ReplyDelete
  14. Apakah ada penelitian/jurnal yg dapat menjadi patokan berapa banyak resampling dalam pengujian?

    ReplyDelete
  15. Apakah metode bootstrap ini dapat digunakan untuk analisis faktor yang memepengaruhi suatu hal? Misalnya penggunaan metode bootstrap untuk mengetahui faktor faktor kemiskinan

    ReplyDelete
  16. nice blog!! i hope you will share a blog on Data Science.
    data analytics course in yelahanka

    ReplyDelete
  17. Apakah dalam estimasi regresi nenggunakan metode bootstrap masih mempertimbangkan asusi klasiknya dari hasil estimasinya atau asumsi klasiknya sudah tidak dipertimbangkan?

    ReplyDelete
  18. Apakah bootstrap bisa digunakan pada data katagorik? lalu adakah literatur utk saran brp kali sebaiknya di resample?

    ReplyDelete
  19. Fantastic blog! Thanks for sharing a very interesting post, I appreciate to blogger for an amazing post.
    Plant Engineering Service
    3D Laser Scanning Modelling
    Reverse Engineering Cad Drawings

    ReplyDelete
  20. Just rocking, keep doing this. predict your future with the best astrologer Raghuram.Spiritual Healing Astrologer in Bangalore

    ReplyDelete
  21. Thanks a lot for the kind of perfect topic I have not a lot of information about it but I have got an extra unique info in your unique post.
    tory burch sydney

    ReplyDelete
  22. Thanks a lot for giving us such a helpful information. You can also visit our website for need of study in project report

    ReplyDelete
  23. Awesome Blog! Thanks for sharing this post. It is an interesting post for everyone. When i read about this post then got more information. I like it.

    ESD Gloves

    Nitrile Gloves

    ESD Table Mat

    ReplyDelete

  24. lenovo laptop service center in noida

    lenovo laptop service center in noida, laptop service center near me ,lenovo servicecenter provides best services for laptop repair, screen replacement, motherboard replacement, hard disk replacement, data recovery, power supply replacement, etc. We provide our services at affordable price. Our technicians have experience of repairing laptops since last 10 years. We provide free pick-up and drop facility. You can contact us anytime 24/7.
    If you want to repair your laptop at your home then you may call us +91-9891868324

    **laptopsservice.center**

    **Main Office : Plot No 135, 2nd Floor, Kakrola Housing complex main market road , Near Metro Pillar no. 789,**

    **E Mail : info(at)deallaptopservicecenter(dot)com**

    **phone no.91-9891868324**

    lenovo-service-center noida
    lenovo-service-center delhi
    lenovo-service-center greater-noida
    lenovo-service-center gurgaon
    lenovo-service-center ghaziabad
    lenovo-service-center faridabad
    lenovo-service-center mumbai
    lenovo-service-center lucknow
    lenovo-service-center kanpur

    ReplyDelete
  25. I really appreciate this wonderful post that you have provided for us. I assure this would be beneficial for most of the people.
    the statue of unity

    ReplyDelete
  26. very Good Information if you are Struggling Quickbooks Problems then to get Quickbooks Solution at Quickbooks Customer Service Phone Number

    ReplyDelete
  27. halo pak apakah fasilitas boothstrapping bisa digunakan ketika ingin menguji one sampel t test pada spss 25? apakah kita tidak usah meneliti normalitas sampel?

    ReplyDelete
  28. It's a magnificent blog and it was very informative while reading. I look forward to reading more of your blogs. Get more info about certified quickbooks specialist

    ReplyDelete