Validitas dalam Penyusunan Alat Ukur


Validitas menyangkut apa yang diukur tes dan seberapa baik tes tersebut bisa mengukur (Anastasi & Urbina, 1997). Suatu tes yang dinyatakan reliabel, namun belum tentu tes tersebut valid. Sedangkan jika tes tersebut dinyatakan valid, maka tes tersebut akan reliabel. Pengujian reliabilitas tidak memberikan kesimpulan tentang apa yang diukur tes, melainkan hanya memberi informasi bahwa hasil pengukuran tes tersebut konsisten (Crocker & Algina, 1986). Sebuah tes tidak akan dinyatakan valid, jika tes tersebut tidak reliabel. Cohen dan Swerdlik (2005) bahkan juga berpendapat serupa bahwa reliablitas itu memang penting, namun reliabilitas tidaklah cukup untuk suatu tes yang baik, karena tes haruslah valid. Lebih lanjut kemudian, validitas dipahami sebagai bagian dari karakteristik skor tes, bukan karakteristik tes.

Menurut pandangan teori klasik, validitas mengunjukkan seberapa dekat besaran skor tampak dengan skor murni. Semakin dekat skor tampak dengan skor murni, berarti eror pengukurannya semakin kecil, yang itu artinya semakin valid pengukuran tersebut. Secara umum, ada tiga prosedur validasi dalam sudut pandang teori klasik yaitu prosedur validitas isi (content validity), validitas kriteria (criterion-related validity) dan validitas konstruk (construct validity).

Validitas isi
Validitas isi terkait dengan kelayakan item-item dalam tes guna mewakili komponen dari kawasan isi materi yang diukur atau sejauh mana item tersebut  sesuai dengan indikator keperilakuan dari atribut yang diukur. Validitas isi harus dilakukan sejak awal pengembangan tes. Prosedur ini terkait dengan domain perilaku yang hendak diukur, di mana analisis terhadap domain perilaku ini dilakukan sejak awal atau sejak dimulainya prosedur pengembangan tes dan bukan setelah tes dipersiapkan. Layak tidaknya suatu item disipulkan dari hasil penilaian (judgement) yang dilakukan oleh ahli berdasarkan logic. Judgement ini dapat ditingkatkan objektivitasnya jika dilakukan oleh banyak orang. Hasil penilaian ini dapat dinyatakan dalam bentuk indeks validitas isi seperti yang dinyatakan oleh Lawshe dengan CVR dan Aiken dengan indeks Aiken’s V.

Koefisien validitas Aiken’s V didasarkan pada hasil penilaian panel ahli sebanyak n orang terhadap suatu item mengenai sejauh mana item tersebut mewakili konstrak. Formula untuk menghitung koefisien validitas Aiken’s V adalah (Aiken, 1985)
lo = angka penilaian validitas terendah
c = angka penilaian validitas tertinggi
r = angka yang diberikan penilai
s = r – lo

Validitas konstrak
Validitas konstrak mengungkap kesesuaian antara stuktur konstrak yang diteorikan dengan data hasil tes. Validitas kontstrak merupakan proses yang berlanjut terus seiring dengan perkembangan konsep/teori mengenai trait yang diukur (Azwar, 2015). Dalam Anastasi dan Urbina (1997) juga dilanjutkan dengan pemaparan teknik atau cara untuk mengidentifikasi konstruk yang digunakan dalam prosedur validasi ini, di antaranya: faktor perubahan perkembangan, korelasi dengan tes lain, analisis faktor, konsistensi internal, validasi konvergen dan diskriminan, intervensi eksperimental, Structural Equation Modelling, dan kontribusi psikologi kognitif.

Salah satu studi yang dilakukan untuk mengidentifikasi validitas konstrak adalah dengan pendekatan multitrait-multimethod. Metode yang dilakukan dengan pendekatan multitrait-multimethod adalah dengan mengadmistrasikan alat tes yang mengukur trait yang sama namun dengan metode yang berbeda serta mengadmistrasikan trait yang berbeda dengan metode yang sama maupun yang berbeda. Dengan metode ini dapat disimpulkan adanya validitas konvergen, yakni tingginya koefisien korelasi pada tes yang mengukur trait yang sama meskipun dengan metode yang berbeda, dan validitas diskriminan yaitu rendahnya koefisien korelasi ada tes yangmengukur trait yang berbeda meskipun dengan metode yang sama.

Validitas konstrak juga dapat dilakukan melalui prosedur analisis faktor konfirmatori (Confirmatory Factor Analysis). Analisis faktor merupakan sekumpulan prosedur matematika yang komplek guna menganalisis saling hubungan di antara variabel serta menjelaskan saling hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang disebut faktor (Azwar, 2015). Prosedur analisis faktor dapat dilakukan dengan menambahkan tes yang bukan mengukur trait apa yang ingin kita validasi, yang kemudian disebut marker test. Adanya validitas kontrak ditunjukkan dengan rendahnya loading factor pada tes pada faktor yang tidak diungkap. Pengertian ini hampir mirip dengan  validitas konvergen dan diskriminan.

Validitas kriteria
Anastasi dan Urbina (1997) menjelaskan bahwa prosedur validitas kriteria (criterion validity) menunjukkan efektifitas tes yang digunakan untuk memprediksi performa seseorang. Kriteria yang dijadikan tolak ukur validasi skor tes bisa diperoleh pada saat yang hampir bersamaan atau setelah dalam rentang waktu tertentu. Terdapat dua jenis validitas kriteria yang keduanya dibedakan berdasarkan waktu antara tes dengan kriteria, yaitu concurrent validity (validitas konkuren) dan predictive validity (validitas prediktif).  

Validitas prediktif misalnya digunakan untuk seleksi, baik itu seleksi masuk perguruan tinggi atau seleksi kerja. Dalam validitas ini terdapat rentang waktu yang cukup lama antara hasil tes dengan membandingkannya pada kriteria. Tes dikatakan valid apabila orang-orang yang memperoleh skor tinggi pada saat seleksi menunjukkan performa yang memuaskan saat kuliah atau saat kerja.
Validitas konkuren tidak memerlukan rentang waktu lama untuk membandingkan hasil tes dengan kriterianya, misal  bisa dibandingkan dengan Indeks Prestasi Kumulatif (IPK) pada saat pengetesan terjadi, atau skor performa karyawan dengan skor kesuksesan bekerja saat itu (Anastasi & Urbina, 1997). Pada dasarnya penentuan validitas apa yang dipakai ditentukan dari tujuannya. Jika tujuan dari tes adalah untuk melakukan diagnosis maka digunakanlah pengujian validitas konkuren. Sedangkan jika tes digunakan untuk memprediksi hasil-hasil di masa depan maka digunakan pengujian validitas prediktif.

Referensi
Anastasi, A. & Urbina, S. (1997). Psychological Testing. 7th edition. New Jersey: Prentice-Hall.
Aiken, L. R. (1985). Three Coefficients for Analyzing the Reliability and Validity of Ratings.
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Cohen, R,J. & Swerdlik, M.E. (2005). Psychological Testing and Assessment. 6th edition. New York: McGraw-Hill Companies, Inc.
Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. Fort Worth : Harcourt Brace Jovanovich College Publishers.



Mahasiswa PhD di ELTE, Hungaria. Dosen Psikologi di UMM, Indonesia.

Share this

Related Posts

Previous
Next Post »

1 komentar:

Write komentar
February 7, 2022 at 4:16 AM delete

This is a greaat post thanks

Reply
avatar

Validitas menyangkut apa yang diukur tes dan seberapa baik tes tersebut bisa mengukur (Anastasi & Urbina, 1997). Suatu tes yang dinyatakan reliabel, namun belum tentu tes tersebut valid. Sedangkan jika tes tersebut dinyatakan valid, maka tes tersebut akan reliabel. Pengujian reliabilitas tidak memberikan kesimpulan tentang apa yang diukur tes, melainkan hanya memberi informasi bahwa hasil pengukuran tes tersebut konsisten (Crocker & Algina, 1986). Sebuah tes tidak akan dinyatakan valid, jika tes tersebut tidak reliabel. Cohen dan Swerdlik (2005) bahkan juga berpendapat serupa bahwa reliablitas itu memang penting, namun reliabilitas tidaklah cukup untuk suatu tes yang baik, karena tes haruslah valid. Lebih lanjut kemudian, validitas dipahami sebagai bagian dari karakteristik skor tes, bukan karakteristik tes.

Menurut pandangan teori klasik, validitas mengunjukkan seberapa dekat besaran skor tampak dengan skor murni. Semakin dekat skor tampak dengan skor murni, berarti eror pengukurannya semakin kecil, yang itu artinya semakin valid pengukuran tersebut. Secara umum, ada tiga prosedur validasi dalam sudut pandang teori klasik yaitu prosedur validitas isi (content validity), validitas kriteria (criterion-related validity) dan validitas konstruk (construct validity).

Validitas isi
Validitas isi terkait dengan kelayakan item-item dalam tes guna mewakili komponen dari kawasan isi materi yang diukur atau sejauh mana item tersebut  sesuai dengan indikator keperilakuan dari atribut yang diukur. Validitas isi harus dilakukan sejak awal pengembangan tes. Prosedur ini terkait dengan domain perilaku yang hendak diukur, di mana analisis terhadap domain perilaku ini dilakukan sejak awal atau sejak dimulainya prosedur pengembangan tes dan bukan setelah tes dipersiapkan. Layak tidaknya suatu item disipulkan dari hasil penilaian (judgement) yang dilakukan oleh ahli berdasarkan logic. Judgement ini dapat ditingkatkan objektivitasnya jika dilakukan oleh banyak orang. Hasil penilaian ini dapat dinyatakan dalam bentuk indeks validitas isi seperti yang dinyatakan oleh Lawshe dengan CVR dan Aiken dengan indeks Aiken’s V.

Koefisien validitas Aiken’s V didasarkan pada hasil penilaian panel ahli sebanyak n orang terhadap suatu item mengenai sejauh mana item tersebut mewakili konstrak. Formula untuk menghitung koefisien validitas Aiken’s V adalah (Aiken, 1985)
lo = angka penilaian validitas terendah
c = angka penilaian validitas tertinggi
r = angka yang diberikan penilai
s = r – lo

Validitas konstrak
Validitas konstrak mengungkap kesesuaian antara stuktur konstrak yang diteorikan dengan data hasil tes. Validitas kontstrak merupakan proses yang berlanjut terus seiring dengan perkembangan konsep/teori mengenai trait yang diukur (Azwar, 2015). Dalam Anastasi dan Urbina (1997) juga dilanjutkan dengan pemaparan teknik atau cara untuk mengidentifikasi konstruk yang digunakan dalam prosedur validasi ini, di antaranya: faktor perubahan perkembangan, korelasi dengan tes lain, analisis faktor, konsistensi internal, validasi konvergen dan diskriminan, intervensi eksperimental, Structural Equation Modelling, dan kontribusi psikologi kognitif.

Salah satu studi yang dilakukan untuk mengidentifikasi validitas konstrak adalah dengan pendekatan multitrait-multimethod. Metode yang dilakukan dengan pendekatan multitrait-multimethod adalah dengan mengadmistrasikan alat tes yang mengukur trait yang sama namun dengan metode yang berbeda serta mengadmistrasikan trait yang berbeda dengan metode yang sama maupun yang berbeda. Dengan metode ini dapat disimpulkan adanya validitas konvergen, yakni tingginya koefisien korelasi pada tes yang mengukur trait yang sama meskipun dengan metode yang berbeda, dan validitas diskriminan yaitu rendahnya koefisien korelasi ada tes yangmengukur trait yang berbeda meskipun dengan metode yang sama.

Validitas konstrak juga dapat dilakukan melalui prosedur analisis faktor konfirmatori (Confirmatory Factor Analysis). Analisis faktor merupakan sekumpulan prosedur matematika yang komplek guna menganalisis saling hubungan di antara variabel serta menjelaskan saling hubungan tersebut dalam bentuk kelompok variabel yang terbatas yang disebut faktor (Azwar, 2015). Prosedur analisis faktor dapat dilakukan dengan menambahkan tes yang bukan mengukur trait apa yang ingin kita validasi, yang kemudian disebut marker test. Adanya validitas kontrak ditunjukkan dengan rendahnya loading factor pada tes pada faktor yang tidak diungkap. Pengertian ini hampir mirip dengan  validitas konvergen dan diskriminan.

Validitas kriteria
Anastasi dan Urbina (1997) menjelaskan bahwa prosedur validitas kriteria (criterion validity) menunjukkan efektifitas tes yang digunakan untuk memprediksi performa seseorang. Kriteria yang dijadikan tolak ukur validasi skor tes bisa diperoleh pada saat yang hampir bersamaan atau setelah dalam rentang waktu tertentu. Terdapat dua jenis validitas kriteria yang keduanya dibedakan berdasarkan waktu antara tes dengan kriteria, yaitu concurrent validity (validitas konkuren) dan predictive validity (validitas prediktif).  

Validitas prediktif misalnya digunakan untuk seleksi, baik itu seleksi masuk perguruan tinggi atau seleksi kerja. Dalam validitas ini terdapat rentang waktu yang cukup lama antara hasil tes dengan membandingkannya pada kriteria. Tes dikatakan valid apabila orang-orang yang memperoleh skor tinggi pada saat seleksi menunjukkan performa yang memuaskan saat kuliah atau saat kerja.
Validitas konkuren tidak memerlukan rentang waktu lama untuk membandingkan hasil tes dengan kriterianya, misal  bisa dibandingkan dengan Indeks Prestasi Kumulatif (IPK) pada saat pengetesan terjadi, atau skor performa karyawan dengan skor kesuksesan bekerja saat itu (Anastasi & Urbina, 1997). Pada dasarnya penentuan validitas apa yang dipakai ditentukan dari tujuannya. Jika tujuan dari tes adalah untuk melakukan diagnosis maka digunakanlah pengujian validitas konkuren. Sedangkan jika tes digunakan untuk memprediksi hasil-hasil di masa depan maka digunakan pengujian validitas prediktif.

Referensi
Anastasi, A. & Urbina, S. (1997). Psychological Testing. 7th edition. New Jersey: Prentice-Hall.
Aiken, L. R. (1985). Three Coefficients for Analyzing the Reliability and Validity of Ratings.
Azwar, S. (2015). Dasar-dasar Psikometri. Yogyakarta: Pustaka Pelajar
Cohen, R,J. & Swerdlik, M.E. (2005). Psychological Testing and Assessment. 6th edition. New York: McGraw-Hill Companies, Inc.
Crocker, L. & Algina, J. (1986). Introduction to classical and modern test theory. Fort Worth : Harcourt Brace Jovanovich College Publishers.



1 comment

Artikel Lainnya