Ketika kita menggunakan pendekatan kuantitatif dalam melakukan
sebuah penelitian, tentunya kita akan menggunakan alat ukur untuk mendapatkan
data yang dibutuhkan. Alat ukur berguna untuk menguantifikasikan variabel yang
ingin diukur. Seperti halnya jika kita ingin mengetahui tekanan darah, kita
bisa menggunakan tensimeter. Tentunya, tensimeter yang sudah dikalibrasi
sehingga menghasilkan nilai tekanan darah yang valid dan reliabel. Pengukuran
tekanan darah merupakan contoh pengukuran atribut fisik. Bagaimana jika kita
ingin mengukur atribut psikologis?
Perlunya Melakukan Uji Linearitas dan Cara Mengatasi Data Tidak Linear
Hanif Akhtar
Dalam beberapa analisis statistik parametrik, seperti
korelasi pearson dan analisis regresi, salah satu asumsi yang mendasari
analisis adalah hubungan antar variabel membentuk pola (model) yang linear.
Model linear artinya pola hubungan kedua variabel independen dan dependen akan
membentuk satu garis lurus. Beberapa pendapat muncul terkait perlu tidaknya
kita menguji asumsi linearitas ini terlebuh dahulu sebelum melakukan uji
hipotesis. Pendapat ini wajar saja, karena memang uji hipotesis, dengan
korelasi pearson misalnya, mendasarkan hubungannya harus linear, jadi ketika
hasil korelasi signifikan, sudah dipastikan asumsi linearitas juga terpenuhi.
Jadi menguji asumsi linearitas di awal adalah sesuatu yang mubazir.
Memahami Penggunaan Signifikansi 1-tailed dan 2-tailed
Dalam pengujian hipotesis, kita
sering langsung melihat pada nilai signifikansinya (p). Ketika nilai signifikansi
kurang dari 0,05 (p<0,05) maka hipotesis nihil ditolak dan hipotesis alternatif
diterima (Field, 2013). Panduan tersebut menjadi
dasar ketika membaca hasil pengujian hipotesis sehingga dengan mudah kita
menyimpulkan terdapat hubungan/perbedaan atau tidak terdapat
hubungan/perbedaan. Namun, kita tidak melihat apakah hipotesis tersebut diuji berdasar
1-tailed atau 2-tailed. Hal ini dikarenakan kita tidak sadar akan keberadaan
istilah tersebut dan tidak tahu fungsi dari adanya istilah tersebut.
Perbedaan Kategorisasi Data berdasarkan Statistik Hipotetik dan Empirik
Hanif Akhtar
Dalam kita mengkategorisasikan data, terkadang pertanyaan
yang sering muncul adalah, kita mau pakai statistik hipotetik atau empirik nih?
Dulu waktu skripsi, saya menggunakan statistik hipotetik karena dalam buku salah
satu profesor saya (Pak Azwar), untuk mengkategorikan subjek ke dalam kelompok tinggi,
sedang, dan rendah yang digunakan adalah statistik hipotetik. Namun kemudian
oleh dosen penguji prosedur saya ini dikatakan salah. “Untuk apa kita mengambil
data sampel, kalau kita mengkategorisasikannya memakai statistik hipotetik”,
begitu kata beliau. Saya yang saat itu masih polos diam saja dan mengiyakan saja
perkataan dosen penguji. Sekarang saya coba merefleksikan saran itu kembali
dan menuliskan pendapat saya
mengenai perbedaan keduanya di sini. Untuk cara kategorisasinya dapat dilihat di sini
Oiya, bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.
Oiya, bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.
Ilustrasi
Dalam suatu ujian matematika, dari 100 soal yang ada, Ali
berhasil menjawab soal 55 dengan benar. Pertanyaannya, bagaimanakah kategori
nilai Ali tersebut, apakah termasuk kelompok rendah, sedang, atau tinggi? Jika
dalam ujian itu hanya Ali saja yang diuji, tentulah kita tidak memiliki
pembanding, dengan demikian satu-satunya pembanding yang dapat digunakan adalah
alat tes tersebut. Karena nilai 55 hanya sedikit di atas mean (mean
hipotetik=50), maka bisa kita katakan nilai Ali tersebut sedang. Namun bagaimana
jika soal tersebut sebenarnya sangat sulit, dan mean dari nilai 100 siswa dalam
ujian matematika ini adalah 25? Tentu bisa kita katakan, nilai Ali ini masuk kategori
tinggi dalam kelompoknya. Kita juga bisa mengatakan, jika dengan melihat jumlah
soal, secara keseluruhan nilai matematika 100 siswa tersebut adalah rendah.
Jika digambarkan bentuk histogramnya kira-kira seperti
ini.
Kembali ke pengelompokan menggunakan statistik hipotetik
atau empirik. Penggunaan statistik empirik didasarkan pada kurve normal
distribusi skor suatu kelompok, dengan demikian kategorisasi dengan menggunakan
statistik empirik akan selalu menghasilkan pola kategori yang sesuai seperti
bentuk kurve normal, yakni yang masuk kategori sedang selalu lebih banyak
dibanding yang masuk kategori tinggi dan rendah. Sementara penggunaan statistik
hipotetik tidak selalu mengikuti kurve normal dari skor kelompok.
Sebagai gambaran, dari contoh di atas kalau digunakan
statistik empirik dan hipotetik, kurang lebih kategoriasinya akan seperti ini.
Hasil kategorisasi berdasarkan statistik empirik
Kelompok
|
Jumlah
|
Rendah
|
21 (21%)
|
Sedang
|
50 (50%)
|
Tinggi
|
19 (19%)
|
Hasil kategorisasi berdasarkan statistik hipotetik
Kelompok
|
Jumlah
|
Rendah
|
93 (93%)
|
Sedang
|
4 (4%)
|
Tinggi
|
1 (1%)
|
Dari dua contoh kategorisasi skor matematika di kelas
dengan menggunakan statistik empirik dan hipotetik di atas kita dapat lihat
bahwa, jika kita menggunakan statistik empirik, kategorisasi akan membentuk
distribusi normal, sedangkan pada statistik hipotetik tidak. Lalu apa beda
keduanya? Kembali lagi pada tujuan mengkategorisasikannya. Jika tujuannya
adalah melihat posisi relatif individu pada kelompoknya, maka yang digunakan
adalah statistik empirik. Jadi nilai Ali yang hanya 55 masuk kategori tinggi
dalam kelompok kelas itu. Namun jika tujuannya adalah melihat skor kelompok
secara umum, maka yang digunakan adalah statistik hipotetik.
Jadi secara umum, statistik empirik tepat jika digunakan
untuk interpretasi pada level individu, sedangkan statistik hipotetik cocok
untuk interpretasi kelompok. Menggunakan statistik empirik untuk interpretasi
kelompok tentu akan bias dan tidak memberikan banyak informasi, karena sudah
pasti secara umum subjek akan berada ada kategori sedang. Sementara menggunakan
statistik hipotetik untuk interpretasi individu juga tidak fair karena tidak
melihat nilai anggota kelompok yang lain.
Dalam interpretasi hasil pengukuran kita juga mengenal ada
dua pendekatan yang sering digunakan, yakni referensi berupa norma (norm referenced) dan referensi berupa
kriteria (criterion referenced). Penggunaan
referensi berupa norma berusaha untuk membedakan antara individu dalam
populasi, sementara refrensi berdasarkan kriteria berusaha membedakan penguasaan
individu berdasarkan kriteria yang ditentukan. Sebenarnya kedua hal ini juga
setara dengan penggunaan statistik empirik dan hipotetik. Statistik empirik
setara dengan pendekatan referensi berupa norma, sementara statistik hipotetik
setara dengan pendekatan referensi berupa kriteria.
Dampak dari penggunaan referensi berupa norma adalah
melibatkan sampel yang jumlahnya cukup besar, seperti yang digunakan dalam tes
inteligensi. Skor yang diperoleh seseorang akan dilihat posisi relatifnya
berdasarkan skor pada populasi. Contohnya adalah pada tes Inteligensi. Pada
tahap pembuatan alat tes akan dibuat norma yang digunakan untuk interpretasi
skor individu. Norma dibuat dengan mengambil sampel yang cukup banyak, karena
diharapkan norma ini akan mewakili populasi. (sebagai contoh norma tes WJ-IV
dibuat dari sampel sejumlah 7.000 orang).
Sementara penggunaan referensi menggunakan kriteria menghendaki
alat ukur yang sudah tervalidasi berulang kali. Kriteria yang ditetapkan bisa
disesuaikan dengan tujuan pengukuran. Misalnya, tes TOEFL digunakan untuk
seleksi beasiswa. Pantia menetapkan batas minimal tes TOEFL adalah 500, dengan
demikian interpretasi skor tersebut hanya berlaku pada individu tersebut tanpa
melihat skor kelompok.
Dari penejelasan di atas, dapat dirangkum perbedaan penggunaan
statistik empirik dan hipotetik sebagai berikut.
Statistik
empirik
|
Statistik
hipotetik
|
Digunakan untuk melihat posisi relatif individu
terhadap kelompok
|
Digunakan untuk melihat posisi relatif kelompok beasarkan
alat ukur
|
Interpretasi relatif terhadadap kelompok. Berbeda
kelompok akan menghasilkan kategori yang berbeda.
|
Interpretasi relatif terhadap alat ukur. Berbeda
tingkat kesulitan alat ukur (meskipun megukur variabel yang sama) dapat
menghasilkan kategori yang berbeda.
|
Menggunakan sampel yang besar
|
Menggunakan alat ukur yang sudah tervalidasi berulang
kali
|
Jadi memakai
statistik empirik atau hipotetik?
Secara mudah seperti ini saja
- Jika tujuan utama untuk melihat posisi relatif individu
dalam kelompok, maka gunakan statistik empirik. Jika tujuan utama untuk melihat
posisi relatif kelompok secara umum terhadap alat tes, gunakan statistik
hipotetik.
- Jika alat tes sudah memiliki norma yang disusun dari statistik
empirik sampel dalam jumlah banyak sebelumnya, gunakan statistik empirik. Misal,
tes inteligensi yang sudah dibuat normanya berdasarkan ribuan sampel sebelumnya,
gunakan kategorisasi dari statistik empirik alat tes inteligensi tersebut.
- Jika penelitian hanya dilakukan pada sampel yang sedikit,
atau hanya untuk menggambarkan data kita secara umum tanpa digunakan untuk
interpretasi lebih mendalam terhadap individu, gunakan statistik hipotetik.
Cara Membuat Kategorisasi Data Penelitian dengan SPSS
Hanif Akhtar
Dalam laporan karya ilmiah, peneliti tidak hanya
melaporkan hasil dari uji hipotesisinya dengan statistik inferensial saja,
tetapi juga memberikan deskripsi dari data yang diperoleh. Hal ini dilakukan
untuk memberikan informasi bagi pembaca awam serta kedalaman dalam pembahasan.
Pada umumnya bagian deskriptif subjek memuat
gambaran mengenai jumlah subjek yang dianalisis berdasarkan
karakteristik mereka yang relevan (seperti jenis kelamin, usia, pendidikan,
dll). Deskripsi subjek kemudian diikuti oleh deskripsi data penelitian yang
memuat statistik deskriptif pada masing-masing variabel yang dianalisis, seperti
banyaknya subjek (n), mean (M), deviasi standar (s), varians (s2),
skor minimum (Xmin), dan skor maksimum (Xmaks). Dari
informasi deskriptif yang diperoleh tadi, kita dapat mengetahui keadaan subjek
pada aspek alau variabel yang diteliti.
Salah satu manfaat kita mengetahui itu adalah untuk
mengkategorikan subjek kita memiliki skor skala yang tinggi, sedang, atau
rendah. Oleh karena itu, tulisan kali ini akan memaparkan bagaimana cara
membuat kategorisasi skor subjek dari hasil pengukuran skala dengan SPSS.
Membuat kriteria
kategorisasi
Langkah pertama untuk kita membuat kategorisasi adalah
dengan menetapkan kriterianya terlebih dahulu. Ini juga tidak terlepas dari
berapa jumlah kategori yang akan kita buat, misalkan 3 kategori (rendah,
sedang, tinggi), atau 5 kategori (sangat rendah, rendah, sedang, tinggi, sangat
tinggi). Penentuan kategori ini dadasari atas asumsi bahwa skor populasi subjek
terdistribusi secara normal. Distribusi normal terbagi atas enam bagian atau
enam satuan deviasi standar, seperti pada gambar di bawah.
Untuk mengkategorikan hasil pengukuran menjadi tiga
kategori, pedoman yang bisa digunakan adalah:
Rendah
|
X < M – 1SD
|
Sedang
|
M – 1SD < X < M + 1SD
|
Tinggi
|
M + 1SD < X
|
Sedangkan jika ingin membuat lima kategori, pedoman yang
bisa digunakan adalah:
Sangat Rendah
|
X < M – 1,5SD
|
Rendah
|
M – 1,5SD < X < M – 0,5SD
|
Sedang
|
M – 0,5SD < X < M + 0,5SD
|
Tinggi
|
M + 0,5SD < X < M + 1,5SD
|
Sangat tinggi
|
M + 1,5SD < X
|
Keterangan:
M = Mean
SD = standar deviasi
*Panduan kategorisasi ini dapat dilihat di buku Azwar
(2012).
Sebenarnya tidak ada pedoman khusus tentang berapa jumlah
kategori yang ingin kita buat dan berapa batasan skor pada masing-masing
kategori. Pedoman di atas hanyalah pedoman yang dibuat oleh salah satu ahli
dalam bidang pengukuran. Meskipun demikian, peneliti bisa memodifikasi kreteria
yang dibuat sesuai dengan kebutuhannya, asalkan tetap logis dan proporsional.
Misalkan, saya punya contoh skala asertivitas model skala
likert dengan skala 1-5. Jumlah item dalam skala tersebut adalah 12. Saya ingin
menkategorikan subjek ke dalam 3 kelompok, yakni rendah, sedang, dan tinggi.
Dengan demikian, jika subjek menjawab nilai paling rendah semua, yakni 1, maka
skor yang mungkin didapatkan adalah 1x12 = 12 (Xmin). Sedangkan jika
subjek menjawab nilai paling tinggi semua, yakni 5, maka skor yang mungkin
didapatkan adalah 5x12 = 60 (Xmaks). Dengan demikian Range dari data
tersebut adalah 60-12 = 48. Karena kita tahu bahwa kurve normal terdiri atas 6
standar deviasi, maka tiap standar deviasi nilainya adalah 48/6=8. Kita juga
tahu bahwa dalam kurve normal, nilai mean selalu berada di tengah, dengan
demikian mean = (12+60) / 2 = 36.
Xmin = 12
Xmaks = 60
Range = Xmaks – Xmin
= 60-12 = 48
Mean = (Xmaks + Xmin)
/ 2
= (12+60) / 2 = 36
SD = Range / 6
= 48/6 = 8
Karena kita sudah mendapatkan nilai mean dan SD, maka
kita bisa membuat kriteria kategorisasi berdasarkan pedoman yang sudah ada.
Rendah
|
X < M – 1SD
X < 36 – 8
X < 28
|
Sedang
|
M – 1SD < X < M + 1SD
36 – 8 < X < 36 + 8
28 < X < 44
|
Tinggi
|
M + 1SD < X
36 + 8 < X
44 < X
|
Kita sudah mendapatkan kriteria penentuan kategorisasi,
selanjutnya kita tinggal mencocokkan dengan data kita. Jadi misalkan si A
mendapat skor 30, maka dia memiliki asertivitas yang sedang.
Menentukan
kategori di SPSS
Jika kita memiliki data yang sedikit, misal di bawah 30,
kita masih bisa dengan mudah mengkategorikan dengan manual satu per satu. Namun
jika subjek kita ratusan, alangkah lebih mudah kalau kita memanfaatkan software
seperti Excel atau SPSS. Kali ini saya akan menjelaskan prosedur menentukan
kategorisasi dengan SPSS.
Untuk mengkategorikan data, ikuti langkah berikut
1.
Klik Transform
– Recode into different variables
2.
Masukkan skor total
ke kotak di kanan
3.
Pada output variables, isi name dengan nama variabel baru kita, misal kat_asertivitas
4.
Klik old and new values
5.
Kita akan membuat kode untuk kategori rendah dahulu.
Misal kategori rendah kita kode 1, jadi pada new value kita isi value dengan 1. Karena dari kriteria kita tadi kelompok
rendah adalah yang memiliki X < 28, maka pada bagian old value kita pilih range,
LOWEST through value dan kita isi 27,5.
Kenapa 27,5, kenapa bukan 28 saja? Karena skor 28 sudah masuk kategori sedang,
sedangkan kategori rendah adalah di bawah 28. Jadi kita ambil batasnya adalah
27,5. Lalu kalau sudah klik add. Ini
akan mengubah semua nilai yang memiliki skor dibawah 27,5 menjadi kode 1.
6.
Kita lanjut membuat kode kategori sedang. Misal kategori sedang kita kode 2, jadi pada new value kita isi value dengan 2. Karena dari kriteria kita tadi kelompok sedang adalah yang
memiliki 28 < X < 44, maka pada bagian old value kita pilih range
dan isi kotak pertama dengan 28 dan kotak kedua dengan 43,5.
Kenapa batas atasnya 43,5, kenapa bukan 44 saja? Sama seperti langkah
sebelumnya, karena 44 sudah masuk kategori tinggi, sedangkan sedang adalah
dibawah 44. Lalu kalau sudah klik add.
Ini akan mengubah semua nilai yang memiliki skor 28 sd 43,5 menjadi kode 2.
7.
Kita lanjut membuat kode untuk kategori tinggi. Misal kategori tinggi kita kode 3, jadi pada new value kita isi value dengan 3. Karena dari kriteria kita tadi
kelompok tinggi adalah yang memiliki 44 < X, maka pada bagian old value kita pilih range, value through HIGHEST dan kita
isi 44. Lalu klik add. Ini akan
mengubah semua nilai yang memiliki skor 44 ke atas menjadi kode 3.
8.
Kalau sudah, klik continue
9.
Klik change,
lalu OK
Jika kita kembali ke data kita, kita akan menjumpai
variabel baru bernama kat_asertivitas. Variabel
itu tak lain adalah kategori skor subjek pada variabel asertivitas. angka 1
menunjukkan rendah, 2 menunjukkan sedang, dan 3 menunjukkan tinggi.
Untuk mengubah label kode, kita bisa klik tab variable view di kiri bawah, lalu kita
klik pada variabel kat_asertivitas, klik kotak pada kolom values, lalu kita beri values
labels. Value 1 label rendah, lalu
klik add. Value 2 label sedang, lalu klik add. Value 3 label tinggi, lalu klik
add. Jika sudah klik OK.
Sekarang kita sudah selesai mengkategorikan subjek ke
dalam kelompok rendah, sedang, atau tinggi asertivitasnya sesuai dengan skor
skala yang diperoleh.
Menghitung
frekuensi masing-masing kelompok
Untuk mengh itung berapa jumlah subjek yang memiliki
asertivitas rendah, sedang, dan tinggi, kita dapat memanfaatkan menu frequencies
di SPSS. Caranya adalah:
1. Klik Analyze – descriptive statistics – frequencies
2.
Masukkan variabel kat_asertivitas,
lalu klik OK
3.
Akan keluar output seperti gambar di bawah
Sampai disini kita sudah bisa mengetahui bahwa sebagian
besar subjek memiliki asertivitas yang tinggi (59,3%), dan hanya sedikit sekali
yang memiliki asertivitas rendah (2,8%).
Prosedur di atas adalah cara mengkategorisasikan data
berdasarkan pada statistik hipotetik.
Prosedur ini dijelaskan Prof. Azwar dalam bukunya Azwar (2012) dan di jurnal
Azwar (1993). Penggunaan statistika hipotetik menggunakan alat ukur sebagai
acuan. Penggunaan prosedur ini mensyaratkan alat ukur yang digunakan adalah
alat ukur yang sudah divalidasi. Selain penggunaan statistik hipotetik,
beberapa peneliti juga menggunakan statistik
empirik. Perbedaan keduanya akan dibahas pada artikel lain.
REFERENSI
Azwar, S. (1993). "Kelompok subjek ini memiliki
harga diri yang rendah"; kok, tahu...? Buletin
Psikologi, I(2), 13-17.
Azwar, S. (2012). Penyusunan
Skala Psikologi edisi 2. Yogyakarta: Pustaka Pelajar
Subscribe to:
Posts (Atom)
Ketika kita menggunakan pendekatan kuantitatif dalam melakukan
sebuah penelitian, tentunya kita akan menggunakan alat ukur untuk mendapatkan
data yang dibutuhkan. Alat ukur berguna untuk menguantifikasikan variabel yang
ingin diukur. Seperti halnya jika kita ingin mengetahui tekanan darah, kita
bisa menggunakan tensimeter. Tentunya, tensimeter yang sudah dikalibrasi
sehingga menghasilkan nilai tekanan darah yang valid dan reliabel. Pengukuran
tekanan darah merupakan contoh pengukuran atribut fisik. Bagaimana jika kita
ingin mengukur atribut psikologis?
Dalam beberapa analisis statistik parametrik, seperti
korelasi pearson dan analisis regresi, salah satu asumsi yang mendasari
analisis adalah hubungan antar variabel membentuk pola (model) yang linear.
Model linear artinya pola hubungan kedua variabel independen dan dependen akan
membentuk satu garis lurus. Beberapa pendapat muncul terkait perlu tidaknya
kita menguji asumsi linearitas ini terlebuh dahulu sebelum melakukan uji
hipotesis. Pendapat ini wajar saja, karena memang uji hipotesis, dengan
korelasi pearson misalnya, mendasarkan hubungannya harus linear, jadi ketika
hasil korelasi signifikan, sudah dipastikan asumsi linearitas juga terpenuhi.
Jadi menguji asumsi linearitas di awal adalah sesuatu yang mubazir.
Dalam pengujian hipotesis, kita
sering langsung melihat pada nilai signifikansinya (p). Ketika nilai signifikansi
kurang dari 0,05 (p<0,05) maka hipotesis nihil ditolak dan hipotesis alternatif
diterima (Field, 2013). Panduan tersebut menjadi
dasar ketika membaca hasil pengujian hipotesis sehingga dengan mudah kita
menyimpulkan terdapat hubungan/perbedaan atau tidak terdapat
hubungan/perbedaan. Namun, kita tidak melihat apakah hipotesis tersebut diuji berdasar
1-tailed atau 2-tailed. Hal ini dikarenakan kita tidak sadar akan keberadaan
istilah tersebut dan tidak tahu fungsi dari adanya istilah tersebut.
Dalam kita mengkategorisasikan data, terkadang pertanyaan
yang sering muncul adalah, kita mau pakai statistik hipotetik atau empirik nih?
Dulu waktu skripsi, saya menggunakan statistik hipotetik karena dalam buku salah
satu profesor saya (Pak Azwar), untuk mengkategorikan subjek ke dalam kelompok tinggi,
sedang, dan rendah yang digunakan adalah statistik hipotetik. Namun kemudian
oleh dosen penguji prosedur saya ini dikatakan salah. “Untuk apa kita mengambil
data sampel, kalau kita mengkategorisasikannya memakai statistik hipotetik”,
begitu kata beliau. Saya yang saat itu masih polos diam saja dan mengiyakan saja
perkataan dosen penguji. Sekarang saya coba merefleksikan saran itu kembali
dan menuliskan pendapat saya
mengenai perbedaan keduanya di sini. Untuk cara kategorisasinya dapat dilihat di sini
Oiya, bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.
Oiya, bagi yang belum tahu maksudnya statistik hipotetik dan empirik, jadi gambarannya begini. Statistik yang dimaksud di sini banyak merujuk ke mean dan standar deviasi (SD). Jadi statistik hipotetik adalah nilai mean dan SD yang mungkin diperoleh dari sejumlah item soal. Jadi kalau suatu tes dengan skala 0-4 memiliki 6 item, maka nilai terendah (Xmin) yang mungkin diperoleh adalah 0 dan nilai tertinggi yang mungkin diperoleh (Xmaks) adalah 24. Dengan demikian mean hipotetiknya adalah titik tengah 0 dan 24 yaitu 12. Sementara SD hipotetiknya adalah 24/6=4. Sementara statistik empirik adalah statistik yang diperoleh dari data sesungguhnya pada sampel kita. Bisa jadi nilai mean dan SD nya lebih tinggi, lebih rendah, atau sama dengan mean dan SD hipotetiknya.
Ilustrasi
Dalam suatu ujian matematika, dari 100 soal yang ada, Ali
berhasil menjawab soal 55 dengan benar. Pertanyaannya, bagaimanakah kategori
nilai Ali tersebut, apakah termasuk kelompok rendah, sedang, atau tinggi? Jika
dalam ujian itu hanya Ali saja yang diuji, tentulah kita tidak memiliki
pembanding, dengan demikian satu-satunya pembanding yang dapat digunakan adalah
alat tes tersebut. Karena nilai 55 hanya sedikit di atas mean (mean
hipotetik=50), maka bisa kita katakan nilai Ali tersebut sedang. Namun bagaimana
jika soal tersebut sebenarnya sangat sulit, dan mean dari nilai 100 siswa dalam
ujian matematika ini adalah 25? Tentu bisa kita katakan, nilai Ali ini masuk kategori
tinggi dalam kelompoknya. Kita juga bisa mengatakan, jika dengan melihat jumlah
soal, secara keseluruhan nilai matematika 100 siswa tersebut adalah rendah.
Jika digambarkan bentuk histogramnya kira-kira seperti
ini.
Kembali ke pengelompokan menggunakan statistik hipotetik
atau empirik. Penggunaan statistik empirik didasarkan pada kurve normal
distribusi skor suatu kelompok, dengan demikian kategorisasi dengan menggunakan
statistik empirik akan selalu menghasilkan pola kategori yang sesuai seperti
bentuk kurve normal, yakni yang masuk kategori sedang selalu lebih banyak
dibanding yang masuk kategori tinggi dan rendah. Sementara penggunaan statistik
hipotetik tidak selalu mengikuti kurve normal dari skor kelompok.
Sebagai gambaran, dari contoh di atas kalau digunakan
statistik empirik dan hipotetik, kurang lebih kategoriasinya akan seperti ini.
Hasil kategorisasi berdasarkan statistik empirik
Kelompok
|
Jumlah
|
Rendah
|
21 (21%)
|
Sedang
|
50 (50%)
|
Tinggi
|
19 (19%)
|
Hasil kategorisasi berdasarkan statistik hipotetik
Kelompok
|
Jumlah
|
Rendah
|
93 (93%)
|
Sedang
|
4 (4%)
|
Tinggi
|
1 (1%)
|
Dari dua contoh kategorisasi skor matematika di kelas
dengan menggunakan statistik empirik dan hipotetik di atas kita dapat lihat
bahwa, jika kita menggunakan statistik empirik, kategorisasi akan membentuk
distribusi normal, sedangkan pada statistik hipotetik tidak. Lalu apa beda
keduanya? Kembali lagi pada tujuan mengkategorisasikannya. Jika tujuannya
adalah melihat posisi relatif individu pada kelompoknya, maka yang digunakan
adalah statistik empirik. Jadi nilai Ali yang hanya 55 masuk kategori tinggi
dalam kelompok kelas itu. Namun jika tujuannya adalah melihat skor kelompok
secara umum, maka yang digunakan adalah statistik hipotetik.
Jadi secara umum, statistik empirik tepat jika digunakan
untuk interpretasi pada level individu, sedangkan statistik hipotetik cocok
untuk interpretasi kelompok. Menggunakan statistik empirik untuk interpretasi
kelompok tentu akan bias dan tidak memberikan banyak informasi, karena sudah
pasti secara umum subjek akan berada ada kategori sedang. Sementara menggunakan
statistik hipotetik untuk interpretasi individu juga tidak fair karena tidak
melihat nilai anggota kelompok yang lain.
Dalam interpretasi hasil pengukuran kita juga mengenal ada
dua pendekatan yang sering digunakan, yakni referensi berupa norma (norm referenced) dan referensi berupa
kriteria (criterion referenced). Penggunaan
referensi berupa norma berusaha untuk membedakan antara individu dalam
populasi, sementara refrensi berdasarkan kriteria berusaha membedakan penguasaan
individu berdasarkan kriteria yang ditentukan. Sebenarnya kedua hal ini juga
setara dengan penggunaan statistik empirik dan hipotetik. Statistik empirik
setara dengan pendekatan referensi berupa norma, sementara statistik hipotetik
setara dengan pendekatan referensi berupa kriteria.
Dampak dari penggunaan referensi berupa norma adalah
melibatkan sampel yang jumlahnya cukup besar, seperti yang digunakan dalam tes
inteligensi. Skor yang diperoleh seseorang akan dilihat posisi relatifnya
berdasarkan skor pada populasi. Contohnya adalah pada tes Inteligensi. Pada
tahap pembuatan alat tes akan dibuat norma yang digunakan untuk interpretasi
skor individu. Norma dibuat dengan mengambil sampel yang cukup banyak, karena
diharapkan norma ini akan mewakili populasi. (sebagai contoh norma tes WJ-IV
dibuat dari sampel sejumlah 7.000 orang).
Sementara penggunaan referensi menggunakan kriteria menghendaki
alat ukur yang sudah tervalidasi berulang kali. Kriteria yang ditetapkan bisa
disesuaikan dengan tujuan pengukuran. Misalnya, tes TOEFL digunakan untuk
seleksi beasiswa. Pantia menetapkan batas minimal tes TOEFL adalah 500, dengan
demikian interpretasi skor tersebut hanya berlaku pada individu tersebut tanpa
melihat skor kelompok.
Dari penejelasan di atas, dapat dirangkum perbedaan penggunaan
statistik empirik dan hipotetik sebagai berikut.
Statistik
empirik
|
Statistik
hipotetik
|
Digunakan untuk melihat posisi relatif individu
terhadap kelompok
|
Digunakan untuk melihat posisi relatif kelompok beasarkan
alat ukur
|
Interpretasi relatif terhadadap kelompok. Berbeda
kelompok akan menghasilkan kategori yang berbeda.
|
Interpretasi relatif terhadap alat ukur. Berbeda
tingkat kesulitan alat ukur (meskipun megukur variabel yang sama) dapat
menghasilkan kategori yang berbeda.
|
Menggunakan sampel yang besar
|
Menggunakan alat ukur yang sudah tervalidasi berulang
kali
|
Jadi memakai
statistik empirik atau hipotetik?
Secara mudah seperti ini saja
- Jika tujuan utama untuk melihat posisi relatif individu
dalam kelompok, maka gunakan statistik empirik. Jika tujuan utama untuk melihat
posisi relatif kelompok secara umum terhadap alat tes, gunakan statistik
hipotetik.
- Jika alat tes sudah memiliki norma yang disusun dari statistik
empirik sampel dalam jumlah banyak sebelumnya, gunakan statistik empirik. Misal,
tes inteligensi yang sudah dibuat normanya berdasarkan ribuan sampel sebelumnya,
gunakan kategorisasi dari statistik empirik alat tes inteligensi tersebut.
- Jika penelitian hanya dilakukan pada sampel yang sedikit,
atau hanya untuk menggambarkan data kita secara umum tanpa digunakan untuk
interpretasi lebih mendalam terhadap individu, gunakan statistik hipotetik.
Dalam laporan karya ilmiah, peneliti tidak hanya
melaporkan hasil dari uji hipotesisinya dengan statistik inferensial saja,
tetapi juga memberikan deskripsi dari data yang diperoleh. Hal ini dilakukan
untuk memberikan informasi bagi pembaca awam serta kedalaman dalam pembahasan.
Pada umumnya bagian deskriptif subjek memuat
gambaran mengenai jumlah subjek yang dianalisis berdasarkan
karakteristik mereka yang relevan (seperti jenis kelamin, usia, pendidikan,
dll). Deskripsi subjek kemudian diikuti oleh deskripsi data penelitian yang
memuat statistik deskriptif pada masing-masing variabel yang dianalisis, seperti
banyaknya subjek (n), mean (M), deviasi standar (s), varians (s2),
skor minimum (Xmin), dan skor maksimum (Xmaks). Dari
informasi deskriptif yang diperoleh tadi, kita dapat mengetahui keadaan subjek
pada aspek alau variabel yang diteliti.
Salah satu manfaat kita mengetahui itu adalah untuk
mengkategorikan subjek kita memiliki skor skala yang tinggi, sedang, atau
rendah. Oleh karena itu, tulisan kali ini akan memaparkan bagaimana cara
membuat kategorisasi skor subjek dari hasil pengukuran skala dengan SPSS.
Membuat kriteria
kategorisasi
Langkah pertama untuk kita membuat kategorisasi adalah
dengan menetapkan kriterianya terlebih dahulu. Ini juga tidak terlepas dari
berapa jumlah kategori yang akan kita buat, misalkan 3 kategori (rendah,
sedang, tinggi), atau 5 kategori (sangat rendah, rendah, sedang, tinggi, sangat
tinggi). Penentuan kategori ini dadasari atas asumsi bahwa skor populasi subjek
terdistribusi secara normal. Distribusi normal terbagi atas enam bagian atau
enam satuan deviasi standar, seperti pada gambar di bawah.
Untuk mengkategorikan hasil pengukuran menjadi tiga
kategori, pedoman yang bisa digunakan adalah:
Rendah
|
X < M – 1SD
|
Sedang
|
M – 1SD < X < M + 1SD
|
Tinggi
|
M + 1SD < X
|
Sedangkan jika ingin membuat lima kategori, pedoman yang
bisa digunakan adalah:
Sangat Rendah
|
X < M – 1,5SD
|
Rendah
|
M – 1,5SD < X < M – 0,5SD
|
Sedang
|
M – 0,5SD < X < M + 0,5SD
|
Tinggi
|
M + 0,5SD < X < M + 1,5SD
|
Sangat tinggi
|
M + 1,5SD < X
|
Keterangan:
M = Mean
SD = standar deviasi
*Panduan kategorisasi ini dapat dilihat di buku Azwar
(2012).
Sebenarnya tidak ada pedoman khusus tentang berapa jumlah
kategori yang ingin kita buat dan berapa batasan skor pada masing-masing
kategori. Pedoman di atas hanyalah pedoman yang dibuat oleh salah satu ahli
dalam bidang pengukuran. Meskipun demikian, peneliti bisa memodifikasi kreteria
yang dibuat sesuai dengan kebutuhannya, asalkan tetap logis dan proporsional.
Misalkan, saya punya contoh skala asertivitas model skala
likert dengan skala 1-5. Jumlah item dalam skala tersebut adalah 12. Saya ingin
menkategorikan subjek ke dalam 3 kelompok, yakni rendah, sedang, dan tinggi.
Dengan demikian, jika subjek menjawab nilai paling rendah semua, yakni 1, maka
skor yang mungkin didapatkan adalah 1x12 = 12 (Xmin). Sedangkan jika
subjek menjawab nilai paling tinggi semua, yakni 5, maka skor yang mungkin
didapatkan adalah 5x12 = 60 (Xmaks). Dengan demikian Range dari data
tersebut adalah 60-12 = 48. Karena kita tahu bahwa kurve normal terdiri atas 6
standar deviasi, maka tiap standar deviasi nilainya adalah 48/6=8. Kita juga
tahu bahwa dalam kurve normal, nilai mean selalu berada di tengah, dengan
demikian mean = (12+60) / 2 = 36.
Xmin = 12
Xmaks = 60
Range = Xmaks – Xmin
= 60-12 = 48
Mean = (Xmaks + Xmin)
/ 2
= (12+60) / 2 = 36
SD = Range / 6
= 48/6 = 8
Karena kita sudah mendapatkan nilai mean dan SD, maka
kita bisa membuat kriteria kategorisasi berdasarkan pedoman yang sudah ada.
Rendah
|
X < M – 1SD
X < 36 – 8
X < 28
|
Sedang
|
M – 1SD < X < M + 1SD
36 – 8 < X < 36 + 8
28 < X < 44
|
Tinggi
|
M + 1SD < X
36 + 8 < X
44 < X
|
Kita sudah mendapatkan kriteria penentuan kategorisasi,
selanjutnya kita tinggal mencocokkan dengan data kita. Jadi misalkan si A
mendapat skor 30, maka dia memiliki asertivitas yang sedang.
Menentukan
kategori di SPSS
Jika kita memiliki data yang sedikit, misal di bawah 30,
kita masih bisa dengan mudah mengkategorikan dengan manual satu per satu. Namun
jika subjek kita ratusan, alangkah lebih mudah kalau kita memanfaatkan software
seperti Excel atau SPSS. Kali ini saya akan menjelaskan prosedur menentukan
kategorisasi dengan SPSS.
Untuk mengkategorikan data, ikuti langkah berikut
1.
Klik Transform
– Recode into different variables
2.
Masukkan skor total
ke kotak di kanan
3.
Pada output variables, isi name dengan nama variabel baru kita, misal kat_asertivitas
4.
Klik old and new values
5.
Kita akan membuat kode untuk kategori rendah dahulu.
Misal kategori rendah kita kode 1, jadi pada new value kita isi value dengan 1. Karena dari kriteria kita tadi kelompok
rendah adalah yang memiliki X < 28, maka pada bagian old value kita pilih range,
LOWEST through value dan kita isi 27,5.
Kenapa 27,5, kenapa bukan 28 saja? Karena skor 28 sudah masuk kategori sedang,
sedangkan kategori rendah adalah di bawah 28. Jadi kita ambil batasnya adalah
27,5. Lalu kalau sudah klik add. Ini
akan mengubah semua nilai yang memiliki skor dibawah 27,5 menjadi kode 1.
6.
Kita lanjut membuat kode kategori sedang. Misal kategori sedang kita kode 2, jadi pada new value kita isi value dengan 2. Karena dari kriteria kita tadi kelompok sedang adalah yang
memiliki 28 < X < 44, maka pada bagian old value kita pilih range
dan isi kotak pertama dengan 28 dan kotak kedua dengan 43,5.
Kenapa batas atasnya 43,5, kenapa bukan 44 saja? Sama seperti langkah
sebelumnya, karena 44 sudah masuk kategori tinggi, sedangkan sedang adalah
dibawah 44. Lalu kalau sudah klik add.
Ini akan mengubah semua nilai yang memiliki skor 28 sd 43,5 menjadi kode 2.
7.
Kita lanjut membuat kode untuk kategori tinggi. Misal kategori tinggi kita kode 3, jadi pada new value kita isi value dengan 3. Karena dari kriteria kita tadi
kelompok tinggi adalah yang memiliki 44 < X, maka pada bagian old value kita pilih range, value through HIGHEST dan kita
isi 44. Lalu klik add. Ini akan
mengubah semua nilai yang memiliki skor 44 ke atas menjadi kode 3.
8.
Kalau sudah, klik continue
9.
Klik change,
lalu OK
Jika kita kembali ke data kita, kita akan menjumpai
variabel baru bernama kat_asertivitas. Variabel
itu tak lain adalah kategori skor subjek pada variabel asertivitas. angka 1
menunjukkan rendah, 2 menunjukkan sedang, dan 3 menunjukkan tinggi.
Untuk mengubah label kode, kita bisa klik tab variable view di kiri bawah, lalu kita
klik pada variabel kat_asertivitas, klik kotak pada kolom values, lalu kita beri values
labels. Value 1 label rendah, lalu
klik add. Value 2 label sedang, lalu klik add. Value 3 label tinggi, lalu klik
add. Jika sudah klik OK.
Sekarang kita sudah selesai mengkategorikan subjek ke
dalam kelompok rendah, sedang, atau tinggi asertivitasnya sesuai dengan skor
skala yang diperoleh.
Menghitung
frekuensi masing-masing kelompok
Untuk mengh itung berapa jumlah subjek yang memiliki
asertivitas rendah, sedang, dan tinggi, kita dapat memanfaatkan menu frequencies
di SPSS. Caranya adalah:
1. Klik Analyze – descriptive statistics – frequencies
2.
Masukkan variabel kat_asertivitas,
lalu klik OK
3.
Akan keluar output seperti gambar di bawah
Sampai disini kita sudah bisa mengetahui bahwa sebagian
besar subjek memiliki asertivitas yang tinggi (59,3%), dan hanya sedikit sekali
yang memiliki asertivitas rendah (2,8%).
Prosedur di atas adalah cara mengkategorisasikan data
berdasarkan pada statistik hipotetik.
Prosedur ini dijelaskan Prof. Azwar dalam bukunya Azwar (2012) dan di jurnal
Azwar (1993). Penggunaan statistika hipotetik menggunakan alat ukur sebagai
acuan. Penggunaan prosedur ini mensyaratkan alat ukur yang digunakan adalah
alat ukur yang sudah divalidasi. Selain penggunaan statistik hipotetik,
beberapa peneliti juga menggunakan statistik
empirik. Perbedaan keduanya akan dibahas pada artikel lain.
REFERENSI
Azwar, S. (1993). "Kelompok subjek ini memiliki
harga diri yang rendah"; kok, tahu...? Buletin
Psikologi, I(2), 13-17.
Azwar, S. (2012). Penyusunan
Skala Psikologi edisi 2. Yogyakarta: Pustaka Pelajar
Subscribe to:
Posts
(
Atom
)