Semesta Psikometrika: Panduan Menentukan Model Fit dalam SEM

Structural Equation Modelling (SEM) merupakan teknik analisis data yang populer di kalangan peneliti dari berbagai disiplin. Bagi mahasiswa doktoral di Ilmu Sosial, analisis ini sudah seperti “menu wajib” yang harus dikuasai. Namun, masalah perkara model teoritis mana yang paling mewakili data masih menjadi perdebatan. Dengan banyaknya indeks fit yang tersedia, dan tidak adanya kesepakatan tentang indeks mana yang harus dilaporkan, membuat menjadi bingung. Selain itu berapa nilai cut-off dari indeks yang ada juga belum disepakati. Tulisan ini merupakan intisari dari tulisan Hooper dkk yang berupaya untuk memperkenalkan berbagai indeks fit yang dapat digunakan sebagai pedoman bagi peneliti SEM serta memberi gambaran indeks fit mana yang paling sering digunakan untuk laporan tulisan ilmiah.

Absolute fit indices

Absolute fit indices menentukan seberapa baik model apriori cocok dengan data sampel dan menunjukkan model mana yang memiliki kecocokan paling unggul. Indeks ini memberikan indikasi paling mendasar tentang seberapa baik teori yang diusulkan cocok dengan data. Yang termasuk dalam kategori ini adalah tes Chi-Squared, RMSEA, GFI, AGFI, RMR dan SRMR.

Model chi-square (χ2)

Nilai Chi-Square adalah ukuran tradisional untuk mengevaluasi kesesuaian model keseluruhan (Hu dan Bentler, 1999). Model fit yang baik akan memberikan hasil yang tidak signifikan pada ambang 0,05 (Barrett, 2007), sehingga statistik Chi-Square sering disebut sebagai 'badness of fit'. Meskipun Chi-square sangat populer, namun indeks ini memiliki beberapa kekurangan. Pertama, indeks ini mengasumsikan normalitas multivariat, dan pelanggaran asumsi ini menyebabkan penolakan model, meskipun bisa jadi model tersebut tepat. Kedua, karena chi-square pada dasarnya adalah uji signifikansi statistik, maka indeks ini sangat terpengaruh oleh besarnya sampel. Jika sampel terlalu kecil, kecenderungannya akan tidak signifikan, sementara jika sampel terlalu besar, kecenderungannya akan signifikan. Dengan demikian, chi-square hampir pasti menolak model jika sampel yang digunakan banyak.

Root mean square error of approximation (RMSEA)

RMSEA adalah statistik fit kedua yang dilaporkan dalam program LISREL dan pertama kali dikembangkan oleh Steiger dan Lind. RMSEA memberi tahu kita seberapa baik model, dengan estimasi parameter yang tidak diketahui tetapi dipilih secara optimal akan sesuai dengan matriks kovarians populasi. Dalam beberapa tahun terakhir, indeks ini dianggap sebagai 'salah satu indeks kecocokan paling informatif' karena kepekaannya terhadap jumlah parameter yang diperkirakan dalam model. Salah satu keuntungan terbesar dari RMSEA adalah adanya interval kepercayaan nilainya. Secara umum RMSEA dalam model yang pas memiliki batas bawah mendekati 0 sedangkan batas atasnya harus kurang dari 0,08.

Goodness-of-fit statistic (GFI) and the adjusted goodness-of-fit statistic (AGFI)

Statistik Goodness-of-Fit (GFI) dibuat oleh Jöreskog dan Sorbom sebagai alternatif dari uji Chi-Square dengan menghitung proporsi varian yang diperhitungkan oleh perkiraan kovarians populasi. Statistik ini berkisar dari 0 hingga 1 dengan jumlah sampel yang besar dapat meningkatkan nilainya. Selain itu, GFI juga cenderung meningkat dengan meningkatnya jumlah parameter dan juga memiliki overestimasi dengan sampel besar. Secara tradisional, batas minimal yang diterima adalah 0,90, namun, studi simulasi telah menunjukkan bahwa ketika factor loading dan ukuran sampel rendah, cut-off yang lebih tinggi dari 0,95 adalah lebih tepat (Miles dan Shevlin, 1998). Mengingat sensitivitas indeks ini, indeks ini menjadi kurang populer dalam beberapa tahun terakhir dan bahkan tidak direkomendasikan untuk digunakan. AGFI adalah indeks yang menyesuaikan GFI berdasarkan derajat kebebasan. Seperti halnya GFI, nilai-nilai untuk AGFI juga berkisar antara 0 dan 1, dan secara umum nilai 0,90 atau lebih menunjukkan model yang fit. Mengingat pengaruh ukuran sampel pada dua indeks kecocokan ini, mereka tidak bisa berdiri sendiri.

Root mean square residual (RMR) and standardised root mean square residual (SRMR)

RMR dan SRMR adalah akar kuadrat dari perbedaan antara residual dari matriks kovarians sampel dan model kovarians hipotesis. Nilai untuk rentang SRMR berkisar dari 0 – 1, dengan model fit yang memiliki nilai kurang dari 0,05 (Byrne, 1998; Diamantopoulos dan Siguaw, 2000), namun nilai setinggi 0,08 dianggap dapat diterima (Hu dan Bentler, 1999).

Incremental fit indices

Incremental fit indices juga dikenal sebagai komparatif (Miles dan Shevlin, 2007) atau indeks kecocokan relatif (McDonald dan Ho, 2002), adalah sekelompok indeks yang tidak menggunakan chi-square dalam bentuk mentahnya tetapi membandingkan nilai chisquare dengan model dasar. Yang termasuk dalam kategori ini adalah NFI dan CFI.

Normed-fit index (NFI)

Statistik ini menilai model dengan membandingkan nilai χ2 dari model dengan χ2 dari model nol. Nilai untuk rentang statistik ini antara 0 – 1. Bentler dan Bonnet (1980) merekomendasikan nilai yang lebih besar dari 0,90 yang menunjukkan kecocokan yang baik. Saran yang lebih baru menyatakan bahwa kriteria cut-off seharusnya menjadi NFI ≥ 0,95 (Hu dan Bentler, 1999). Kelemahan utama indeks ini adalah sensitif terhadap ukuran sampel, akan menghasilkan nilai underestimate jika sampel kurang dari 200 (Mulaik et al, 1989; Bentler, 1990), dan karenanya tidak direkomendasikan untuk untuk digunakan sendirian. Masalah ini diperbaiki oleh Non-Normed Fit Index (NNFI, juga dikenal sebagai indeks Tucker-Lewis (TLI), indeks yang lebih suka model yang lebih sederhana. Masalah terakhir dengan NNFI adalah bahwa karena sifatnya yang non-normed, nilai bisa lebih dari 1,0 dan hal ini sulit untuk ditafsirkan (Byrne, 1998). Bentler dan Hu (1999) telah menyarankan NNFI ≥ 0,95 sebagai ambang batas.

CFI (Comparative fit index)

Comparative Fit Index (CFI: Bentler, 1990) adalah bentuk revisi dari NFI yang memperhitungkan ukuran sampel (Byrne, 1998) yang berkinerja baik bahkan ketika ukuran sampel kecil. Seperti halnya NFI, nilai untuk rentang statistik ini antara 0 - 1. Kriteria cut-off dari CFI awalnya adalah ≥ 0,90, namun penelitian terbaru menunjukkan nilai CFI ≥ 0,95 saat ini diakui sebagai indikasi model fit (Hu dan Bentler, 1999). Saat ini, indeks ini merupakan ukuran paling populer karena menjadi salah satu ukuran yang paling sedikit dipengaruhi oleh ukuran sampel.

Parsimony fit indices

Model yang jenuh dan kompleks menunjukkan bahwa proses estimasi tergantung pada data sampel menghasilkan model teoretis yang kurang kuat yang secara paradoks menghasilkan indeks fit yang lebih baik. Untuk mengatasi masalah ini, Mulaik et al (1989) telah mengembangkan dua indeks fit parsimoni; Parsimony Goodness-of-Fit Index (PGFI) dan Parsimonious Normed Fit Index (PNFI). PGFI didasarkan pada GFI dengan menyesuaikan hilangnya derajat kebebasan, sementara PNFI juga sama namun didasarkan pada NFI. Tidak ada batas nilai yang direkomendasikan untuk menilai model fit berdasarkan kedua indeks ini, namun biasanya nilai yang diharapkan adalah di atas 0,90.

Bentuk kedua dari indeks fit parsimoni juga dikenal sebagai indeks criteria kriteria informasi. Mungkin yang paling dikenal dari indeks ini adalah Akaike Information Criterion (AIC) atau Consistent Version of AIC (CAIC) yang menyesuaikan ukuran sampel (Akaike, 1974). Nilai yang kecil menunjukkan model yang fit dan sederhana. Karena indeks ini tidak dinormalkan ke skala 0-1, sulit untuk menyarankan nilai cut-offnya. Sebagai catatan, statistik ini membutuhkan ukuran sampel 200 untuk membuatnya reliabel. Secara ringkah Hooper, Coughlan, dan Mullen (2008)

Merangkumnya dalam tabel di bawah.

Tabel 1. Indeks fit dan ambang batasnya

Indeks fit	Ambang batas	Keterangan
*Absolute Fit Indices*
Chi-Square χ2	χ2 rendah relatif terhadap df dengan nilai p tidak signifikan (p> 0,05)
Relative χ2 (χ2/df)	2:1 (Tabachnik and Fidell, 2007), 3:1 (Kline, 2005)	Menyesuaikan ukuran sampel
Root Mean Square Error of Approximation (RMSEA)	Nilai kurang dari 0.07 (Steiger, 2007)	Memiliki distribusi yang dikenal. Nilai kurang dari 0,03 mewakili kecocokan yang sangat baik.
GFI	Lebih besar dari 0,95	Skala antara 0 dan 1, dengan nilai yang lebih tinggi menunjukkan kesesuaian model yang lebih baik. Statistik ini harus digunakan dengan hati-hati
AGFI	Lebih besar dari 0,95	Penyesuaian GFI berdasarkan jumlah parameter dalam model. Nilai dapat jatuh di luar rentang 0-1.0.
RMR	Model yang baik memiliki RMR kecil (Tabachnick dan Fidell, 2007)	Berbasis residual. Perbedaan rata-rata kuadrat antara residu kovarian sampel dan residu kovariansi yang diestimasi. Unstandardised
SRMR	Kurang dari 0,08 (Hu dan Bentler, 1999)	Versi standar RMR. Lebih mudah diinterpretasi karena sifatnya yang terstandar
*Incremental Fit Indices*
NFI	Lebih besar dari 0,95	Menilai kecocokan relatif terhadap model baseline yang mengasumsikan tidak ada kovarian antara variabel yang diamati. Cenderung overestimate dalam sampel kecil
NNFI (TLI)	Lebih besar dari 0,95	Nilai yang tidak dinormalkan, bisa berada di luar rentang 0-1. Berperforma baik dalam studi simulasi (Sharma et al, 2005; McDonald dan Marsh, 1990)
CFI	Lebih besar dari 0,95	Normed, rentang 0-1

Melaporkan model fit

Untuk melaporkan indeks fit mana yang harus ditampilkan, tidak perlu memasukkan semua indeks fit yang dikeluarkan oleh program analisis karena akan membebani pembaca maupun reviewer. Meskipun demikian, kita juga tidak boleh hanya menampilkan indeks yang menunjukkan fit paling baik saja karena dapat menghilangkan informasi penting. Meskipun tidak ada aturan pokok mengenai ini, melaporkan berbagai indeks diperlukan karena indeks yang berbeda mencerminkan aspek yang berbeda dari kesesuaian model. Kline (2005) merekomendasikan indeks yang harus dilaporkanadalah uji Chi-Square, RMSEA, CFI dan SRMR. Boomsma (2000) merekomendasikan hal serupa, tetapi menambahkan squared multiple correlations dari setiap persamaan juga dilaporkan. Sementara Hooper, Coughlan, dan Mullen (2008) menyarankan untuk melaporkan nilai Chi-Square, df, dan nilai p-nya; RMSEA dan interval kepercayaannya, SRMR, CFI dan satu indeks kesesuaian parsimoni seperti PNFI. Indeks-indeks ini dipilih karena paling tidak sensitif terhadap ukuran sampel, kesalahan spesifikasi model, dan estimasi parameter.

Meningkatkan model fit

Model yang diajukan terkadang memiliki model fit yang kurang baik. Melakukan modifikasi model merupakan praktek yang berbahaya, namun beberapa modifikasi lokal dapat dilakukan. Modifikasi dapat dilakukan dengan menilai kesesuaian setiap konstruk dan item-itemnya untuk menentukan apakah ada item yang lemah. Item dengan R-square rendah (kurang dari 0,20) harus dihapus dari analisis karena ini merupakan indikasi tingkat kesalahan yang sangat tinggi.

Langkah lain yang sering dilakukan untuk meningkatkan model fit adalah mengkorelasikan antar eror. Praktek ini menunjukkan bahwa ada hal lain yang tidak ditentukan dalam model yang menyebabkan kovarian. Jika seorang peneliti memutuskan untuk mengkorelasikan error tersebut, maka perlu ada justifikasi teoretis yang kuat. Mengkorelasikan error dalam satu variabel lebih dibenarkan daripada korelasi lintas variabel laten, namun dampak statistik dan substantif juga harus dibahas secara jelas. Jika peneliti merasa dapat membuktikan bahwa langkah yang diambil ini tepat, maka mengkorelasikan error ini dapat diterima, namun tetap saja langkah ini perlu dilakukan secara hati-hati.

Referensi utama

Hooper, D., Coughlan, J. and Mullen, M. R. (2008). Structural Equation Modelling: Guidelines for Determining Model Fit. The Electronic Journal of Business Research Methods, 6 (1), 53 – 60

Referensi pendukung

Akaike, H. (1974). A New Look at the Statistical Model Identification. IEE Transactions on Automatic Control, 19 (6), 716-23.

Barrett, P. (2007), Structural Equation Modelling: Adjudging Model Fit. Personality and Individual Differences, 42 (5), 815-24.

Boomsma, A. (2000). Reporting Analyses of Covariance Structures. Structural Equation Modeling, 7 (3), 461-83

Hu, L.T. and Bentler, P.M. (1999). Cutoff Criteria for Fit Indexes in Covariance Structure Analysis: Conventional Criteria Versus New Alternatives. Structural Equation Modeling, 6 (1), 1-55.

Kline, R.B. (2005). Principles and Practice of Structural Equation Modeling (2nd Edition ed.). New York: The Guilford Press.

Mulaik, S.A., James, L.R., Van Alstine, J., Bennet, N., Lind, S., and Stilwell, C.D. (1989). Evaluation of Goodness-of-Fit Indices for Structural Equation Models. Psychological Bulletin, 105 (3), 430-45.

Semesta Psikometrika

Monday, December 2, 2019

Panduan Menentukan Model Fit dalam SEM

No comments:

Post a Comment