Kata “dummy”
kalau diterjemahkan secara harfiah artinya “buatan”. Jadi yang dimaksud dengan
variabel dummy adalah variabel yang nilainya sebenarnya adalah buatan, karena
nilai variabel tersebut sebenarnya bukanlah skala. Atau secara mudahnya,
variabel dummy adalah variabel independen yang wujudnya berskala non-metrik
atau kategori. Jika variabel independen berukuran kategori atau dikotomi, maka
dalam model regresi kita harus nyatakan sebagai variabel dummy dengan memberi
kode 0 atau 1. Setiap variabel dummy menyatakan satu kategori variabel, dan
setiap variabel dengan k kategori dapat dinyatakan dalam k-1 variabel dummy.
Analisis dengan variabel dummy dilakukan pada saat kita
tertarik pada pengaruh variabel independen kategori, atau kita ingin memasukkan
variabel kategori tersebut untuk meningkatkan kualitas penelitian kita. Analisis
regresi dengan menggunakan variabel dummy memiliki kompleksitas, hasil analisis
ini memiliki kemiripan dengan analisis kovarian (anakova), namun sistematika
komputasinya sedikit berbeda. Ingat, prosedur yang disajikan dalam tulisan ini
adalah prosedur analisis regresi dengan variabel independen berupa kategori,
namun jika yang berwujud kategori adalah variabel dependen, maka teknik
analisis yang dilakukan adalah dengan analisis regresi logistik.
Misalkan kita ingin variabel demografi apa saja yang
mampu memprediksi agresivitas. Desain penelitian kita adalah sebagai berikut.
·
Variabel dependen :
agresivitas
·
Variabel independen :
umur, jenis kelamin, suku
Kita punya tiga variabel independen yakni umur (X1),
jenis kelamin (X2), dan suku (X3). Umur adalah variabel kuantitatif, sedangkan
jenis kelamin dan suku merupakan kategori. Jenis kelamin terdiri atas dua
kategori, yakni laki-laki dan perempuan, sedangkan suku terdiri atas tiga
kategori, yakni Jawa, Sunda, Madura. Karena jenis kelamin terdiri atas 2
kategori, maka variabel jenis kelamin hanya memiliki satu variabel dummy (2-1),
sedangkan suku terdiri atas 3 kategori, sehingga variabel suku memiliki 2
variabel dummy (3-1).
Membuat kode
variabel dummy
Seperti yang sudah disinggung di atas, jumlah kategori
ditentukan dengan rumus k-1, sedangkan kode yang diberikan adalah 1 dan 0. Semua
responden yang menjadi anggota kategori yang diberi kode 1 sedangkan responden
tidak dalam kategori tersebut dikode dari 0. Dengan cara seperti ini maka
setiap responden akan memiliki kode 1 pada kategori yang sesuai dengannya dan
kode 0 pada kategori yang tidak sesuai dengannya.
Misalkan kita memiliki data seperti di bawah ini.
Subjek
|
Agresivitas
|
Umur
|
Jenis kelamin
|
Suku
|
A
|
45
|
52
|
Laki-laki
|
Jawa
|
B
|
43
|
41
|
Perempuan
|
Sunda
|
C
|
47
|
40
|
Laki-laki
|
Madura
|
D
|
53
|
58
|
Perempuan
|
Jawa
|
E
|
60
|
46
|
Laki-laki
|
Madura
|
Pada kategori 2
kelompok, sebenarnya tidak ada aturan baku mana yang harus diberi kode 1 mana
yang 0. Tapi agar memudahkan pemaknaan terhadap hasil berilah angka 1 pada
kategori yang secara teoritik akan memiliki nilai prediksi lebih tinggi. Misal
secara teoritik, agresivitas ini lebih mampu diprediksi oleh laki-laki, maka
laki-laki kita beri kode 1. Dari data mentah kita, kita bisa ubah input data
kita seperti di bawah ini.
Subjek
|
Agresivitas
|
Umur
|
Laki-laki
|
Jawa
|
Sunda
|
A
|
45
|
52
|
1
|
1
|
0
|
B
|
43
|
41
|
0
|
0
|
1
|
C
|
47
|
40
|
1
|
0
|
0
|
D
|
53
|
58
|
0
|
1
|
0
|
E
|
60
|
46
|
1
|
0
|
0
|
Subjek A adalah
laki-laki Jawa, maka pada variabel laki-laki dan Jawa kita beri skor 1,
sedangkan ada variabel sunda kita beri skor 0. Sedangkan subjek E adalah
laki-laki madura, maka pada variabel laki-laki kita beri skor 1, sedangkan pada
variabel Jawa dan Sunda kita beri skor 0 (artinya bukan keduanya).
Input data di
SPSS
Karena pemberian kode 1 dan 0 terlalu melelahkan jika
harus dilakukan secara manual, apalagi kalau subjek kita sampai ratusan, maka
ada beberapa cara yang lebih cepat untuk membuat kode. Salah satu cara yang
paling umum dilakukan adalah dengan fungsi “if” di excel. Pada tulisan ini saya
akan langsung memberikan cara inut kode variabel dummy di SPSS.
Sebelum kita membuat variabel dummy, seperti biasa, kita
ubah terlebih dahulu variabel kategori kita dengan angka nominal. Misalkan dalam
contoh di atas, saya ubah laki-laki=1, perempuan=2, Jawa=1, Sunda=2, Madura=3.
Dengan demikian pada contoh data di atas data akan berubah seperti ini. Untuk
mengubah kode ini cukup mudah, gunakan saja find and replace dengan menekan ctrl+h.
Subjek
|
Agresivitas
|
Umur
|
Jenis kelamin
|
Suku
|
A
|
45
|
52
|
1
|
1
|
B
|
43
|
41
|
2
|
2
|
C
|
47
|
40
|
1
|
3
|
D
|
53
|
58
|
2
|
1
|
E
|
60
|
46
|
1
|
3
|
Misalkan kita akan membuat variabel Dummy laki-laki. Untuk
membuat kode pada variabel dummy laki-laki, ikut langkah berikut.
1. Klik transform
– recode into defferent variables
2.
Masukkan variabel JenisKelamin,
kemudian pada output variable name
tuliskan laki, lalu klik change. Ini artinya kita akan membuat
variabel baru bernama laki dari data variabel JenisKelamin.
3.
Klik old and new
value
4.
Pada old value,
masukkan nilai value adalah 1,
kemudian pada new value masukan
nilai value adalah 1. Kemudian tekan
Add. Prosedur ini akan mengubah
laki-laki yang sudah kita kode 1 tadi menjadi angka 1
5.
Kemudian pada old value klik all other values, dan pada new values masukkan value adalah 0. Prosedur
ini akan mengubah nilai yang bukan merupakan 1 (laki-laki) menjadi nilai 0.
6.
Klik continue,
lalu ok
Jika kita kembali ke data kita, maka sudah muncul
variabel baru, yakni laki. Variabel laki memiliki nilai 1 dan 0, dimana 1
menunjukkan laki-laki, dan nol menunjukkan perempuan.
Untuk membuat variabel dummy Jawa dan Sunda, lakukan
kembali prosedur di atas. Data SPSS yang sudah dibuat variabel dummy untuk
latihan ini dapat di download di sini.
Mulai analisis
regresi dengan variabel dummy
Untuk analisis regresi di SPSS, kita bisa menggunakan
regresi berganda (multiple regression)
atau regresi berjenjang (hierarchical
regression). Jika kita hendak melihat peran semua variabel independen kita gunakan
regresi berganda. Namun jika kita ingin melihat peran tiap variabel independen
secara berurutan kita gunakan regresi berjenjang. Pada contoh kali ini kita
akan menggunakan regresi berganda.
Analisis regresi berganda kali ini dilakukan untuk
melihat peran umur, jenis kelamin, dan suku secara bersama-sama terhadap
agresivitas. Untuk mulai analisis regresi berganda, ikuti langkah berikut.
1. Klik analyze – regression – linear
2.
Masukan variabel agresivitas
pada kotak dependent
3.
Masukkan variabel umur,
laki, jawa, dan sunda pada kotak
independent
4.
Klik ok
Output hasil analisis dapat dilihat pada gambar di bawah
Terlihat pada tabel ANOVA
bahwa secara bersama-sama semua variabel independen berperan terhadap
agresivitas secara signifikan (F=8,850 dan p<0,05). Pada tabel Model Summary, diketahui bahwa sumbangan
efektif variabel umur, jenis kelamin, dan suku terhadap agresivitas adalah 26,1%
(R square = 0,261). Sisanya dijelaskan oleh hal lain diluar ketiga variabel
tersebut.
Pada tabel coefficients,
kita dapat melihat bahwa secara sendiri-sendiri, hanya umur dan laki saja
yang signifikan. Artinya hanya kedua variabel ini saja yang berperan terhadap
agresivitas.
Umur berperan terhadap agresivitas (B=-0,194, dan
P<0,05). Karena B nilainya negatif, artinya arah hubungan antara umur dan
agresivitas adalah berbanding terbalik. Jika umur naik satu poin, maka
agrasifitas diprediksikan akan turun 0,194 poin.
Laki juga berperan terhadap agresivitas (B=8,275 dan p<0,05),
atau secara sederhana kita dapat mengatakan bahwa ada perbedaan yang signifikan
agresivitas antara laki-laki dan perempuan. Laki-laki memiliki agresivitas yang
lebih tinggi. Secara matematis, jika jenis kelamin berubah dari perempuan
menjadi laki-laki (dari 0 menjadi 1), maka skor agresivitas diprediksikan akan
naik 8,275 poin. Interpretasi matematis ini tentu harus disertai pertimbangan
logis.
Pada variabel dummy suku, Jawa memiliki agresivitas yang
lebih rendah dibanding Madura (exclude
group). Hal ini ditunjukkan oleh nilai B yang negatif. Begitu pula Sunda juga
memiliki agresivitas yang lebih rendah dibandingkan Madura. Namun, perlu
diperhatikan bahwa semua variabel dummy pada suku tersebut tidak signifikan. Hal
ini berarti sebenarnya tidak ada perbedaan agresivitas pada tiga suku Jawa,
Sunda, Madura. Jadi interpretasi di atas akan berguna jika secara statistik
koefisien variabel dummy signifikan.
pak kenapa datanya tidak bisa di download ? harus minta akses dulu
ReplyDeleteMau tanya pak.. apa arti dari nilai koefisien variabel dummy.? Bagaimana menerangkan koefisien dummy yang negatif..
ReplyDeleteTerima kasih
Tolong buatkan analisisya
ReplyDeleteMas mau tanya, untuk Madura dan jenis kelamin perempuan yang di-exclude group-kan itu statusnya bagaimana ya? apakah berpengaruh terhadap agresivitas atau tidak? terima kasih
ReplyDeletePengaruh bisa dilihat dari signifikansi. Untuk perempuan karena pada laki-laki signifikan, artinya jenis kelamin berpengaruh, Untuk Madura, karena suku yang lain tidak signifikan, artinya tidak berpengaruh
ReplyDeletepa berarti data di atas ada variabel biasa dan variabel dummy yah pa
ReplyDeleteIya, untuk variabel dummy hanya untuk variabel independen saja, untuk dependen tetap continuous. Kalau variabel dependennya yang kategori analisisnya beda, dengan regresi logistik
DeleteMas, saya mau tanya.. Kalau dummy coding ini pakai uji normalitas lagi gak ya?
ReplyDeleteMas sya mau nanya hasil spssnya kenapa tidak Madura cuma Jawa sama sunda
ReplyDeleteIya madura masuk sebagai excluded variabel, sama seperti perempuan yang juga tidak muncul. Jika jawa o dan sunda 0, otomatis dia adalah madura. Pengaruh bisa dilihat dari signifikansi, karena suku yang lain tidak signifikan, artinya tidak berpengaruh
DeletePak variabel dummy menggunakan uji apa saja ya pak?soalnya saya pakai variabel dummy tapi ga lolos uji normalitas dan uji autokorelasi pak🙏🏻
DeletePak mau bertanya jika variabel dummynya dalam bentuk kuisioner dengan bebeapa indikator pertanyaan seperti x1.a,x1.b dst.. yg diinput ke spssnya jumlah data dari tiap indikator pertanyaan. Apa bagaimana pak?
ReplyDeletejika pada variabel suku, jawa signifikan dan sunda tidak signifikan bagaimana? apakah variabel suku masuk kedalam model dan di interpretasikan?
ReplyDeletedan adakah referensi buku atau jurnal yang bapak ketahui mengenai kasus yang saya tanyakan?
kak saya mau tanya apakah kriteria 0 dan 1 untuk indetifikasi variabel dummy itu mutlak? apakah bisa kriteria dummy skor nya pakai 1 dan 2 kak? mohon jawaban atas pertanyaan saya kak
ReplyDeletePak izin bertanya jika variabel independen ada 3 dan ketiganya mengunakan dummy, serta variabel dependen juga dummy, sebaiknya analisis data menggunakan regresi apa ya pak ? Terima kasih
ReplyDeletePak variabel dummy menggunakan uji apa saja ya pak?soalnya saya pakai variabel dummy tapi ga lolos uji normalitas dan uji autokorelasi pak🙏🏻
ReplyDelete