Selain menyajikan hasil analisis pada level item, Winstep juga mampu menyediakan hasil
analisis pada tes. Script yang sudah kita buat dalam tulisan sebelumnya untuk latihan dapat didownload di sini. Untuk mendapatkan informasi mengenai ringkasan statistik
dari alat tes yang disajikan kita bisa munculkan dari menu output tables lalu pilih tabel
3.1 summary statistics. Akan muncul tampilan seperti ini
Keterangan dari output tersebut akan dijelaskan di bawah
- Mean measure pada person adalah sebesar -0,85. Nilai mean yang lebih
kecil dari 0 menunjukkan bahwa kecenderungan abilitas subjek lebih kecil
dibandingkan dengan tingkat kesulitan soal.
- Nilai Alpha Cronbach (KR-20) adalah
koefisien reliabilitas yang dihitung berdasarkan pendekatan teori tes klasik.
Nilai ini merupakan interaksi antara person dan item secara keseluruhan. Nilai
Alpha adalah sebesar 0,54. Hal ini menunjukan reliabilitas tes ecara umum masih
belum memuaskan
- Nilai person reliability adalah
0,49 dan nilai item reliability adalah 0,95. Hal ini menunjukkan
bahwa konsistensi jawaban dari subjek kita masih lemah, namun kualitas butir
soal dalam instrumen aspek reliabilitasnya cukup baik.
- Nilai INFIT dan OUTFIT MNSQ niai
yang ideal adalah yang mendekati 1 sedangkan untuk nilai INFIT dan
OUTFIT ZSTD nilai yang ideal adalah mendekati 0. Untuk tabel person
dan item, nilai meannya INFIT dan OUTFIT MNSQ serta INFIT dan OUTFIT ZSTD sudah
mendekati ideal.
- Nilai separation juga
menunjukkan kualitas instrumen maupun kualitas subjek kita. Semakin besar nilai
separation semakin bagus karena bisa mengidentifikasi kelompok subjek (mampu –
tidak mampu) dan kelompok butir (sulit – mudah) yang lebih luas. Rumus yang
bisa digunakan untuk melihat pengelompokan secara lebih teliti disebut
pemisahan strata dengan formula sebagai berikut:
H = [(4 X separation) + 1] / 3
- Jadi misalkan item separation kita adalah 4,18
maka H = [(4 X 4,18) + 1] / 3 yakni 5,9 atau dibulatkan 6, yang berarti
terdapat 6 kelompok butir soal.
Secara lebih lengkap, Fisher, W.P. Jr memberikan panduan
untuk menilai kualitas instrumen yang dapat dilihat di tabel di bawah.
Fungsi Informasi Pengukuran
Setiap pengukuran menghasilkan informasi mengenai hasil
pengukuran. Informasi pengukuran yang diinginkan bukan berdasar pada individu
yang diukur, melainkan informasi pada fokus pengukuran. Informasi pengukuran
ini berdasar pada hubungan antara tes dengan individu. Sumintono
dan Widhiarso (2015) menjelaskan beberapa manfaat dari fungsi informasi tes
adalah sebagai berikut:
- Fungsi informasi akan menunjukkan untuk apa pengukuran dilakukan. Sebagai contoh, untuk tes screening, tes remidi, dan tes untuk Anak Berkebutuhan Khusus memusatkan tes dengan fungsi informasi seperti grafik warna merah. Sebaliknya jika tes dilakukan untuk seleksi yang ketat, fungsi informasi tes yang dibutuhkan adalah tes dengan fungsi informasi seperti pada grafik warna hitam.
- Fungsi informasi menunjukkan reliabilitas pengukuran yang dilakukan. Model Rasch menekankan pada koefisien separasi (item separation). Semakin tinggi puncak informasi yang dapat dicapai, semakin tinggi nilai reliabilitas pengukuran yang dilakukan.
Untuk melihat fungsi informasi
pengukuran, kita dapat melihat melalui menu graph kemudian pilih test
information function, maka akan diperoleh outut seperti di bawah ini.
Dari grafik di atas kita dapat
menyimpulkan bahwa dari 40 soal yang kita sajikan pada 185 subjek menunjukkan
item-item soalnya cocok untuk menetahui tingkat abilitas siswa yang sedang
saja.
Referensi
Sumintono, B., & Widhiarso, W. (2015). Aplikasi Pemodelan
Rasch pada Assessment Pendidikan. Cimahi: Trim Komunikata.
Maaf sebelumnya saya mau tanya, apakah sama tabel untuk menentukan kriteria kualitas rating scale dengan instrumen tes?
ReplyDeleteAssalammu'alaikum, maaf sebeumnya izin bertanya mengenai test information function. Apakah ada kriteria khusus yang digunakan untuk menentukan hasil grafik tersebut menandakan instrumen baik digunakan untuk kelompok peserta didik dengan kemampuan yang bagaimana? Terima kasih
ReplyDeleteIni bisa dilakukan dengan melihat perpotongan antara grafik fungsi informasi dengan garis Standar eror of measurement
DeleteDaerah di dalam batasan tersebut merupakan rentang ability yang optimal diukur oleh instrumen
This comment has been removed by the author.
ReplyDeleteMaaf mau tanya, jika nilai reliability person kurang dr 0,67 ttp nilai reliability item lebih dr 0,67 apakah bisa dilanjutkan penelitian ya?
ReplyDelete