Tuesday, August 29, 2017

Analisis Regresi Tunggal dan Berganda dengan R

Koefien korelasi hanya mampu menggambarkan kuat lemahnya hubungan dua variabel, namun tidak mampu menjelaskan hubungan sebab akibat. Analisis regresi mempelajari bentuk hubungan antara satu atau lebih variabel bebas (X) dengan satu variabel tergantung (Y). Oleh karena itu, secara umum dapat dikatakan analisis regresi merupakan kelanjutan dari analisis korelasi karena dapat menentukan daya prediksi perubahan variabel Y akibat perubahan variabel X.

Untuk memanggil kembali data kita seperti pada analisis sebelumnya, ketikkan kembali script setwd("C:/Users/Hanif/Google Drive/BLOGSPOT/UNTUK DIDOWNLOAD") dan perilakucsv<-read.csv("perilaku merokok.csv",header=TRUE,sep = ";") lalu kita run. Maka akan muncul data perilakucsv. Script silakan disesuaikan dengan nama file anda dan tempat menyimpan file tersebut. Jangan lupa untuk mengubah tanda back-slash (\) menjadi tanda slash (/) untuk menunjukkan lokasi file. Data ini yang akan kita gunakan di analisis selanjutnya. Data dapat didownload di sini

Analisis Regresi Tunggal
Analisis regresi dilakukan untuk melihat daya prediksi jika terjadi perubahan pada variabel X terhadap variabel Y. Jika analisis dilakukan pada satu variabel dependen dan satu variabel independen, maka kita gunakan analisis regresi tunggal. Misalkan kita ingin melihat pengaruh sikap terhadap perilaku merokok. Kita masukan script ini lm(perilakucsv$PERILAKU~perilakucsv$SIKAP), maka output pada console yang akan dihasilkan adalah sebagai berikut.
Output yang disajikan masih terbatas. Oleh karena itu kita dapat meminta output yang lebih lengkap mengenai taraf signifikansinya. Masukan script summary(lm(perilakucsv$PERILAKU~perilakucsv$SIKAP)), maka akan diperoleh output seperti di bawah
Dari output di atas kita dapat menyimpulkan bahwa sikap berperan terhadap perilaku merokok (p-value <0,01). Dari output tersebut juga terlihat multiple R-squared (R2) sebesar 0,30. Itu artinya variabel sikap mampu menjelaskan 30% variasi variabel perilaku merokok, sedangkan 70% sisanya dijelaskan oleh variabel lain. Selain itu kita juga dapat menuliskan persamaan regresinya. Rumus umum persamaan regresi adalah Y = a + bX.
Jika kita masukan nilainya, maka persamaan regresinya menjadi:
Perilaku merokok = -5,35 + 0,79 sikap.
Hal ini menunjukkan jika seseorang tidak memiliki sikap sama sekali, maka perilaku merokoknya adalah -5,35, sedangkan setiap satu poin kenaikan sikap anak menaikkan perilaku merokok sebesar 0,79.

Analisis Regresi Berganda
Analisis regresi berganda dilakukan jika ada lebih dari satu variabel independen dalam memprediksi satu variabel dependen. Misal, kita ingin mengetahui pengaruh sikap dan pengetahuan terhadap perilaku merokok. Masukkan script ini lm(perilakucsv$PERILAKU~perilakucsv$SIKAP+perilakucsv$PENGETAHUAN) kemudian run, maka di console akan muncul output berupa nilai koefisien regresi masing-masing variabel. Output ini hampir sama seperti pada analisis regresi tunggal. Informasi dari output ini masih sangat minim karena tidak memberikan informasi signifikansi. Untuk memunculkan output yang lebih lengkap, masukkan script summary(lm(perilakucsv$PERILAKU~perilakucsv$SIKAP+perilakucsv$PENGETAHUAN)), maka akan muncul output seperti di bawah ini.

Ada dua hal yang dapat kita cermati dari output di atas, yakni uji statistik F dan uji statistik t. Uji statistik F digunakan untuk melihat apakah variabel independen secara bersama-sama berpengaruh terhadap variabel dependen. Sedangkan uji statistik t adalah untuk meilhat pengaruh satu variabel independen secara individual dalam menerangkan variasi variabel dependen.

Dari output di atas, nilai F adalah sebesar 25,42 dengan p-value < 0,01, sehingga dapat kita simpulkan bahwa pengetahuan dan sikap secara bersama-sama berperan terhadap perilaku merokok. Dari output tersebut juga terlihat multiple R-squared (R2) sebesar 0,33. Itu artinya variabel sikap dan pengetahuan mampu menjelaskan 33% variasi variabel perilaku merokok, sedangkan 67% sisanya dijelaskan oleh variabel lain.

Dari uji t, kita lihat nilat t sikap adalah 5,49 dan koefisien regresinya sebesar 0,69, sedangkan nilai t pengetahuan adalah 1,95 dan koefisien regresinya adalah 0,95. Uji signifikansi kedua variabel ternyata ditemukan bahwa hanya sikap saja yang signifikan (p<0,01), sedangkan pengetahuan tidak signifikan (p>0,05). Hal ini berarti hanya sikap saja yang berpengaruh secara indivual terhadap perilaku merokok. Persamaan regresinya adalah sebagai berikut:
Perilaku merokok = -8,47 + 0,69 sikap + 0,65 pengetahuan


7 comments:

  1. Artikelnya sangat membantu kak.
    salam dari makassar :D

    ReplyDelete
  2. This comment has been removed by the author.

    ReplyDelete
  3. mau tanya kak...klo uji asumsi klasik di R bagaimana ya? terima kasih

    ReplyDelete
  4. terima kasih banyak mas.. sangat membantu sekali..

    ReplyDelete
  5. This comment has been removed by the author.

    ReplyDelete
  6. bagus dan mudah dimengerti, tapi datanya tidak bisa didownload ka..

    ReplyDelete