Ketika kita menggunakan pendekatan kuantitatif dalam melakukan
sebuah penelitian, tentunya kita akan menggunakan alat ukur untuk mendapatkan
data yang dibutuhkan. Alat ukur berguna untuk menguantifikasikan variabel yang
ingin diukur. Seperti halnya jika kita ingin mengetahui tekanan darah, kita
bisa menggunakan tensimeter. Tentunya, tensimeter yang sudah dikalibrasi
sehingga menghasilkan nilai tekanan darah yang valid dan reliabel. Pengukuran
tekanan darah merupakan contoh pengukuran atribut fisik. Bagaimana jika kita
ingin mengukur atribut psikologis?
Untuk mengukur atribut psikologis, alat ukur yang bisa digunakan
ialah tes dan skala (Azwar, 2016). Tes mengukur atribut psikologis yang bersifat performa maksimal.
Sedangkan skala mengukur atribut psikologis yang bersifat tipikal atau kecenderungan.
Bagaimana kita tahu alat ukur tersebut valid dan reliabel? Inilah yang sering
menjadi pertanyaan besar bagi kita semua.
Alat ukur yang reliabel bisa dilihat dari koefisien
reliabilitasnya. Lalu, bagaimana dengan alat ukur yang valid ? Dengan cara
apa kita mengetahui alat ukur tersebut valid ?
Kebanyakan penelitian mahasiswa S1 (skripsi) menyimpulkan instrumen
penelitian mereka valid dengan dasar nilai corrected item-total correlation yang baik. Nilai tersebut baik karena bernilai di atas 0,3 atau
sedikit toleransi hingga di atas 0,25 (Azwar, 2015, 2018). Di tambah dengan expert judgement terutama dosen
pembimbing. Pertanyaan yang muncul, apakah benar kedua hal tersebut dapat
menjadi patokan validitas alat ukur?
Jawabannya, BENAR namun tidak sepenuhnya benar. Mengapa?
- Expert judgement merupakan satu cara untuk mendapatkan bukti validitas berdasar isi tes (Furr & Bacharach, 2013). Ketika pendapat expert terhadap teori dan konsep psikometri menunjukkan bahwa alat tersebut valid maka hal ini menjadi salah satu indikator validitas alat ukur tersebut. Namun demikian, kita tidak boleh langsung mengatakan alat ukur ini valid. Masih terdapat beberapa “parameter” mengenai validitas yang harus didapatkan bukti keberadaannya.
- Corrected item-total correlation merupakan salah satu parameter dari properti psikometris level butir. Namun demikian, nilai ini tidak termasuk parameter yang secara spesifik mendukung validitas bahkan tidak termasuk dalam bukti validitas pada konsep validitas terbaru (Furr & Bacharach, 2013).
Lantas, apa yang ditunjukkan oleh nilai corrected item-total correlation pada hasil uji coba skala?
Corrected item-total correlation merupakan output dari analisis yang dilakukan oleh SPSS. Corrected item-total correlation berasal dari nilai item-total correlation yang disempurnakan. Maksudnya disempurnakan ialah untuk
menghilangkan efek spurious overlap (baca “Pedoman Analisis Item Menggunakan Pendekatan Teori TesKlasik”). Item-total correlation merupakan nilai korelasi antara skor butir
dengan skor total skala. Korelasi skor yang didapat subjek pada butir nomor 24
dengan skor total yang didapat subjek pada skala tersebut merupakan nilai item-total correlation untuk butir nomor 24.
Prinsipnya ialah korelasi, lebih spesifiknya korelasi menggunakan product moment pearson. Berarti ketika suatu butir berkorelasi dengan keseluruhan skor
skala, maka dapat dikatakan butir tersebut mengukur hal yang selaras.
Perlu diingat, kata selaras berbeda dengan kata tepat. Mengapa? Karena
ketika suatu alat ukur tersebut memiliki butir yang selaras namun tidak
mengukur apa yang diukur maka dapat dikatakan skala tersebut tidak valid atau
tidak tepat.
Secara gampangnya, corrected item-total correlation merupakan salah satu parameter yang bertujuan untuk melihat
kesesuaian fungsi butir dengan fungsi keseluruhan skala. Semakin tinggi nilai
korelasinya maka alat tersebut memiliki keselarasan atau konsistensi pada skala
tersebut. Dengan demikian, kita pasti bertanya, konsistensi? Mirip dengan
reliabilitas ya? Iya memang, namun bukan nilai reliabilitas melainkan parameter
yang dapat meningkatkan atau menurunkan reliabilitas.
Selain untuk melihat kesesuaian fungsi butir dengan fungsi
keseluruhan skala, corrected item-total correlation memperlihatkan seberapa mampu butir tersebut membedakan kelompok
subjek berdasarkan performanya pada variabel yang diukur (kelompok rendah dan
kelompok tinggi). Hal ini yang membuat corrected item-total correlation menjadi sebuah properti psikometris yang dinamakan daya
diskriminasi butir atau daya beda butir.
Prinsip daya beda butir ini sebenarnya mirip dengan fungsi
sebelumnya, yaitu melihat korelasi. Namun demikian, pemaknaannya sedikit
berbeda. Secara lebih jelas, berikut ilustrasi mengenai kedua prinsip tersebut.
ILUSTRASI
Gambar 1 Tabulasi nilai corrected item-total correlation skala
AM-12 (Marvianto, 2018)
Gambar 2 Hasil korelasi product moment
antara AM 10 dengan seluruh skor AM tanpa butir AM 10
|
Gambar 3 Korelasi product moment antara AM 10 dengan
seluruh butir AM
|
Berdasarkan Gambar 1 dapat dilihat nilai korelasi butir total 12
butir skala Achievement Motivation versi pendek. Kita perhatikan pada butir AM 10, korelasi butir-total
sebesar 0,538. Gambar 2 menunjukkan bahwa hasil korelasi antara butir AM 10
dengan seluruh butir AM tanpa skor AM 10
menunjukkan nilai yang sama persis dengan hasil di Gambar 1. Hal ini
menunjukkan bahwa corrected item-total correlation sudah menghilangkan efek spurious overlap. Efek ini dapat dilihat pada Gambar 3, nilai korelasi yang tertera
pada gambar tersebut menunjukkan nilai yang lebih besar atau dapat dikatakan overestimate. Hal ini terjadi karena skor total mengandung skor dari butir AM
10.
Berdasar Gambar 1, dapat kita simpulkan bahwa butir AM 1, 7 dan 9
tidak selaras dengan keseluruhan butir pada AM-12. Pertanyaan yang akan muncul
dan pasti muncul ialah “Apakah ketiga butir ini akan langsung dibuang?”.
Pertanyaan yang sangat menakjubkan. Perlu pembahasan yang panjang untuk
menjawab pertanyaan tersebut. Dalam web ini akan dijelaskan bagaimana proses
membuang atau merevisi butir. Ditunggu yaa hehe….
Lalu, bagaimana ilustrasi untuk daya diskriminasi?
Kita ambil contoh dua butir pada AM-12. Butir AM 10 dan butir AM 7.
Butir 10 tergolong memiliki daya diskriminasi yang baik karena di atas 0,3.
Sedangkan, butir AM 7 tergolong memiliki daya diskriminasi yang buruk karena
nilainya di bawah 0,3. Secara statistik kita dapat melihat perbedaan skor
tersebut melalui grafik korelasinya. Berikut gambar kedua korelasi butir-total
pada butir AM 10 dan AM 7.
Gambar 4
Grafik korelasi AM 10 dengan keseluruhan skala tanpa butir AM 10
Gambar 5 Grafik korelasi AM 7 dengan keseluruhan skala tanpa butir AM 7
|
Kita perhatikan Gambar 4 dan Gambar 5. Berbeda bukan? Apa yang
membedakan? Garis linearnya? Iya secara umum seperti itu. Namun mari kita
cermati Gambar 4, pada gambar empat, subjek yang menjawab angka 1 (Angka 0
menunjukkan performa yang rendah dan angka 4 menunjukkan performa paling
tinggi) memiliki skor di antara 10 – 15, subjek yang menjawab angka 2 memiliki
skor di antara 15 – 30, dan subjek yang menjawab angka 3 memiliki skor total
berkisar 20-35. Secara sekilas, terdapat perbedaan antara skor total subjek
yang menjawab 1 dengan menjawab 3. Hal ini yang dimaksud daya diskriminasi
butir. Seberapa besar butir dapat membedakan kelompok rendah dan kelompok
tinggi.
Pada Gambar 5, subjek yang menjawab 1 memiliki skor total 15 – 25,
sedangkan yang menjawab 2 memiliki skor di antara 10 – 30, dan yang menjawab 3
memiliki skor di antara 15 – 30. Secara sekilas tidak terlalu ada perbedaan
antara subjek yang menjawab 1 dan 3. Mengapa? Karena subjek yang menjawab 1
masih berada pada range skor di mana subjek menjawab 3. Hal ini membuat daya
diskriminasi butir rendah karena butir tidak bisa membedakan subjek dengan
kemampuan rendah dan tinggi.
KESIMPULAN
Corrected item-total correlation merupakan salah
satu parameter yang digunakan untuk mengevaluasi properti psikometris alat
ukur. Dengan kata lain, corrected item-total correlation merupakan properti psikometris yang dinamakan daya beda butir atau daya diskriminasi
butir. Fungsi dari properti ini untuk melihat kesesuaian fungsi butir dengan
keseluruhan tes dan melihat seberapa mampu butir membedakan subjek berdasarkan
performanya. Oleh karena itu, kita tidak dapat berlandas pada properti ini
untuk mengatakan bahwa alat ukur kita valid.
REFERESI
Azwar, S. (2015). Penyusunan Skala Psikologi (Edisi
2). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2016). Konstruksi Tes Kemampuan Kognitif
(Edisi 1). Yogyakarta: Pustaka Pelajar.
Azwar, S. (2018). Metode Penelitian Psikologi (Edisi
II). Yogyakarta: Pustaka Pelajar.
Furr, M. R., & Bacharach, V. R. (2013). Psychometric:
An Introduction (2nd ed.). Amazon: SAGE Publisher.
Marvianto, R. D. (2018). Adaptasi dan Evaluasi Properti
Psikometris Skala Academic Motivation Scale (AMS) versi Bahasa Indonesia.
Universitas Gadjah Mada.
Saya tomy. Saya mau tanya, dari keterangan diatas corrected item-total correlation tidak bisa disebut sebagai alat untuk uji validitas, berarti bagaimana menguji validitas yang benar? Bagaimana dengan korelasi product moment?
ReplyDeleteprinsip korelasi product moment sama seperti korelasi butir-total spt penjelasan diatas,oleh sebab itu korelasi product moment pun tidak dapat menyebutkab bahwa butir valid/tidak. Gunakan uji validitas isi spt expert judgment atau uji analisis faktor
Delete