Structural
Equation Modelling (SEM) merupakan teknik analisis data yang populer di
kalangan peneliti dari berbagai disiplin. Bagi mahasiswa doktoral di Ilmu
Sosial, analisis ini sudah seperti “menu wajib” yang harus dikuasai. Namun,
masalah perkara model teoritis mana yang paling mewakili data masih menjadi perdebatan. Dengan banyaknya indeks fit yang
tersedia, dan tidak adanya kesepakatan tentang indeks mana yang harus
dilaporkan, membuat menjadi bingung. Selain itu berapa nilai cut-off dari
indeks yang ada juga belum disepakati. Tulisan ini merupakan intisari dari tulisan Hooper dkk yang berupaya untuk
memperkenalkan berbagai indeks fit yang dapat digunakan sebagai pedoman bagi peneliti
SEM serta memberi gambaran indeks fit mana yang paling sering digunakan untuk
laporan tulisan ilmiah.
Absolute fit indices
Absolute
fit indices menentukan seberapa baik model apriori cocok dengan data sampel dan
menunjukkan model mana yang memiliki kecocokan paling unggul. Indeks ini
memberikan indikasi paling mendasar tentang seberapa baik teori yang diusulkan
cocok dengan data. Yang termasuk dalam kategori ini adalah tes Chi-Squared,
RMSEA, GFI, AGFI, RMR dan SRMR.
Model chi-square (χ2)
Nilai
Chi-Square adalah ukuran tradisional untuk mengevaluasi kesesuaian model
keseluruhan (Hu dan Bentler, 1999). Model fit yang baik akan memberikan hasil
yang tidak signifikan pada ambang 0,05 (Barrett, 2007), sehingga statistik
Chi-Square sering disebut sebagai 'badness of fit'. Meskipun Chi-square sangat
populer, namun indeks ini memiliki beberapa kekurangan. Pertama, indeks ini
mengasumsikan normalitas multivariat, dan pelanggaran asumsi ini menyebabkan
penolakan model, meskipun bisa jadi model tersebut tepat. Kedua, karena
chi-square pada dasarnya adalah uji signifikansi statistik, maka indeks ini
sangat terpengaruh oleh besarnya sampel. Jika sampel terlalu kecil,
kecenderungannya akan tidak signifikan, sementara jika sampel terlalu besar,
kecenderungannya akan signifikan. Dengan demikian, chi-square hampir pasti
menolak model jika sampel yang digunakan banyak.
Root mean square error of approximation
(RMSEA)
RMSEA
adalah statistik fit kedua yang dilaporkan dalam program LISREL dan pertama
kali dikembangkan oleh Steiger dan Lind. RMSEA memberi tahu kita seberapa baik
model, dengan estimasi parameter yang tidak diketahui tetapi dipilih secara
optimal akan sesuai dengan matriks kovarians populasi. Dalam beberapa tahun
terakhir, indeks ini dianggap sebagai 'salah satu indeks kecocokan paling
informatif' karena kepekaannya terhadap jumlah parameter yang diperkirakan
dalam model. Salah satu keuntungan terbesar dari RMSEA adalah adanya interval
kepercayaan nilainya. Secara umum RMSEA dalam model yang pas memiliki batas
bawah mendekati 0 sedangkan batas atasnya harus kurang dari 0,08.
Goodness-of-fit statistic (GFI) and the
adjusted goodness-of-fit statistic (AGFI)
Statistik
Goodness-of-Fit (GFI) dibuat oleh Jöreskog dan Sorbom sebagai alternatif dari
uji Chi-Square dengan menghitung proporsi varian yang diperhitungkan oleh
perkiraan kovarians populasi. Statistik ini berkisar dari 0 hingga 1 dengan jumlah
sampel yang besar dapat meningkatkan nilainya. Selain itu, GFI juga cenderung meningkat
dengan meningkatnya jumlah parameter dan juga memiliki overestimasi dengan
sampel besar. Secara tradisional, batas minimal yang diterima adalah 0,90,
namun, studi simulasi telah menunjukkan bahwa ketika factor loading dan ukuran sampel rendah, cut-off yang lebih tinggi
dari 0,95 adalah lebih tepat (Miles dan Shevlin, 1998). Mengingat sensitivitas
indeks ini, indeks ini menjadi kurang populer dalam beberapa tahun terakhir dan
bahkan tidak direkomendasikan untuk digunakan. AGFI adalah indeks yang
menyesuaikan GFI berdasarkan derajat kebebasan. Seperti halnya GFI, nilai-nilai
untuk AGFI juga berkisar antara 0 dan 1, dan secara umum nilai 0,90 atau lebih menunjukkan
model yang fit. Mengingat pengaruh ukuran sampel pada dua indeks kecocokan ini,
mereka tidak bisa berdiri sendiri.
Root mean square residual (RMR) and
standardised root mean square residual (SRMR)
RMR dan
SRMR adalah akar kuadrat dari perbedaan antara residual dari matriks kovarians
sampel dan model kovarians hipotesis. Nilai untuk rentang SRMR berkisar dari 0 –
1, dengan model fit yang memiliki nilai kurang dari 0,05 (Byrne, 1998;
Diamantopoulos dan Siguaw, 2000), namun nilai setinggi 0,08 dianggap dapat
diterima (Hu dan Bentler, 1999).
Incremental fit indices
Incremental
fit indices juga dikenal sebagai komparatif (Miles dan Shevlin, 2007) atau
indeks kecocokan relatif (McDonald dan Ho, 2002), adalah sekelompok indeks yang
tidak menggunakan chi-square dalam bentuk mentahnya tetapi membandingkan nilai
chisquare dengan model dasar. Yang termasuk dalam kategori ini adalah NFI dan
CFI.
Normed-fit index (NFI)
Statistik
ini menilai model dengan membandingkan nilai χ2 dari model dengan χ2 dari model
nol. Nilai untuk rentang statistik ini antara 0 – 1. Bentler dan Bonnet (1980)
merekomendasikan nilai yang lebih besar dari 0,90 yang menunjukkan kecocokan
yang baik. Saran yang lebih baru menyatakan bahwa kriteria cut-off seharusnya
menjadi NFI ≥ 0,95 (Hu dan Bentler, 1999). Kelemahan utama indeks ini adalah
sensitif terhadap ukuran sampel, akan menghasilkan nilai underestimate jika
sampel kurang dari 200 (Mulaik et al, 1989; Bentler, 1990), dan karenanya tidak
direkomendasikan untuk untuk digunakan sendirian. Masalah ini diperbaiki oleh
Non-Normed Fit Index (NNFI, juga dikenal sebagai indeks Tucker-Lewis (TLI), indeks
yang lebih suka model yang lebih sederhana. Masalah terakhir dengan NNFI adalah
bahwa karena sifatnya yang non-normed, nilai bisa lebih dari 1,0 dan hal ini
sulit untuk ditafsirkan (Byrne, 1998). Bentler dan Hu (1999) telah menyarankan
NNFI ≥ 0,95 sebagai ambang batas.
CFI (Comparative fit index)
Comparative
Fit Index (CFI: Bentler, 1990) adalah bentuk revisi dari NFI yang
memperhitungkan ukuran sampel (Byrne, 1998) yang berkinerja baik bahkan ketika
ukuran sampel kecil. Seperti halnya NFI, nilai untuk rentang statistik ini
antara 0 - 1. Kriteria cut-off dari CFI awalnya adalah ≥ 0,90, namun penelitian
terbaru menunjukkan nilai CFI ≥ 0,95 saat ini diakui sebagai indikasi model fit
(Hu dan Bentler, 1999). Saat ini, indeks ini merupakan ukuran paling populer
karena menjadi salah satu ukuran yang paling sedikit dipengaruhi oleh ukuran
sampel.
Parsimony fit indices
Model
yang jenuh dan kompleks menunjukkan bahwa proses estimasi tergantung pada data
sampel menghasilkan model teoretis yang kurang kuat yang secara paradoks
menghasilkan indeks fit yang lebih baik. Untuk mengatasi masalah ini, Mulaik et
al (1989) telah mengembangkan dua indeks fit parsimoni; Parsimony
Goodness-of-Fit Index (PGFI) dan Parsimonious Normed Fit Index (PNFI). PGFI
didasarkan pada GFI dengan menyesuaikan hilangnya derajat kebebasan, sementara
PNFI juga sama namun didasarkan pada NFI. Tidak ada batas nilai yang
direkomendasikan untuk menilai model fit berdasarkan kedua indeks ini, namun
biasanya nilai yang diharapkan adalah di atas 0,90.
Bentuk
kedua dari indeks fit parsimoni juga dikenal sebagai indeks criteria kriteria
informasi. Mungkin yang paling dikenal dari indeks ini adalah Akaike
Information Criterion (AIC) atau Consistent Version of AIC (CAIC) yang
menyesuaikan ukuran sampel (Akaike, 1974). Nilai yang kecil menunjukkan model
yang fit dan sederhana. Karena indeks ini tidak dinormalkan ke skala 0-1, sulit
untuk menyarankan nilai cut-offnya. Sebagai catatan, statistik ini membutuhkan
ukuran sampel 200 untuk membuatnya reliabel. Secara ringkah Hooper, Coughlan,
dan Mullen (2008)
Merangkumnya dalam tabel di bawah.
Tabel 1. Indeks fit dan ambang batasnya
Indeks fit
|
Ambang batas
|
Keterangan
|
Absolute
Fit Indices
|
||
Chi-Square
χ2
|
χ2
rendah relatif terhadap df dengan nilai p tidak signifikan (p> 0,05)
|
|
Relative
χ2 (χ2/df)
|
2:1
(Tabachnik and Fidell, 2007), 3:1 (Kline, 2005)
|
Menyesuaikan
ukuran sampel
|
Root
Mean Square Error
of
Approximation (RMSEA)
|
Nilai
kurang dari 0.07 (Steiger, 2007)
|
Memiliki
distribusi yang dikenal. Nilai kurang dari 0,03 mewakili kecocokan yang
sangat baik.
|
GFI
|
Lebih
besar dari 0,95
|
Skala
antara 0 dan 1, dengan nilai yang lebih tinggi menunjukkan kesesuaian model
yang lebih baik. Statistik ini harus digunakan dengan hati-hati
|
AGFI
|
Lebih
besar dari 0,95
|
Penyesuaian
GFI berdasarkan jumlah parameter dalam model. Nilai dapat jatuh di luar
rentang 0-1.0.
|
RMR
|
Model
yang baik memiliki RMR kecil (Tabachnick dan Fidell, 2007)
|
Berbasis
residual. Perbedaan rata-rata kuadrat antara residu kovarian sampel dan
residu kovariansi yang diestimasi. Unstandardised
|
SRMR
|
Kurang
dari 0,08 (Hu dan Bentler, 1999)
|
Versi
standar RMR. Lebih mudah diinterpretasi karena sifatnya yang terstandar
|
Incremental
Fit Indices
|
||
NFI
|
Lebih
besar dari 0,95
|
Menilai
kecocokan relatif terhadap model baseline yang mengasumsikan tidak ada
kovarian antara variabel yang diamati. Cenderung overestimate dalam sampel
kecil
|
NNFI
(TLI)
|
Lebih besar
dari 0,95
|
Nilai
yang tidak dinormalkan, bisa berada di luar rentang 0-1. Berperforma baik
dalam studi simulasi (Sharma et al, 2005; McDonald dan Marsh, 1990)
|
CFI
|
Lebih
besar dari 0,95
|
Normed,
rentang 0-1
|
Melaporkan model fit
Untuk
melaporkan indeks fit mana yang harus ditampilkan, tidak perlu memasukkan semua
indeks fit yang dikeluarkan oleh program analisis karena akan membebani pembaca
maupun reviewer. Meskipun demikian, kita juga tidak boleh hanya menampilkan
indeks yang menunjukkan fit paling baik saja karena dapat menghilangkan
informasi penting. Meskipun tidak ada aturan pokok mengenai ini, melaporkan
berbagai indeks diperlukan karena indeks yang berbeda mencerminkan aspek yang
berbeda dari kesesuaian model. Kline (2005) merekomendasikan indeks yang harus
dilaporkanadalah uji Chi-Square, RMSEA, CFI dan SRMR. Boomsma (2000) merekomendasikan
hal serupa, tetapi menambahkan squared multiple
correlations dari setiap persamaan juga dilaporkan. Sementara Hooper,
Coughlan, dan Mullen (2008) menyarankan untuk melaporkan nilai Chi-Square, df, dan nilai p-nya; RMSEA dan
interval kepercayaannya, SRMR, CFI dan satu indeks kesesuaian parsimoni seperti
PNFI. Indeks-indeks ini dipilih karena paling tidak sensitif terhadap
ukuran sampel, kesalahan spesifikasi model, dan estimasi parameter.
Meningkatkan model fit
Model yang
diajukan terkadang memiliki model fit yang kurang baik. Melakukan modifikasi model
merupakan praktek yang berbahaya, namun beberapa modifikasi lokal dapat
dilakukan. Modifikasi dapat dilakukan dengan menilai kesesuaian setiap konstruk
dan item-itemnya untuk menentukan apakah ada item yang lemah. Item dengan R-square
rendah (kurang dari 0,20) harus dihapus dari analisis karena ini merupakan
indikasi tingkat kesalahan yang sangat tinggi.
Langkah lain
yang sering dilakukan untuk meningkatkan model fit adalah mengkorelasikan antar
eror. Praktek ini menunjukkan bahwa ada hal lain yang tidak ditentukan dalam
model yang menyebabkan kovarian. Jika seorang peneliti memutuskan untuk
mengkorelasikan error tersebut, maka perlu ada justifikasi teoretis yang kuat. Mengkorelasikan
error dalam satu variabel lebih dibenarkan daripada korelasi lintas variabel
laten, namun dampak statistik dan substantif juga harus dibahas secara jelas.
Jika peneliti merasa dapat membuktikan bahwa langkah yang diambil ini tepat,
maka mengkorelasikan error ini dapat diterima, namun tetap saja langkah ini
perlu dilakukan secara hati-hati.
Referensi utama
Hooper, D., Coughlan, J. and Mullen, M. R. (2008). Structural Equation Modelling: Guidelines for Determining Model Fit. The Electronic Journal of Business Research Methods, 6 (1), 53 – 60
Akaike,
H. (1974). A New Look at the Statistical Model Identification. IEE Transactions on Automatic Control, 19
(6), 716-23.
Barrett,
P. (2007), Structural Equation Modelling: Adjudging Model Fit. Personality and Individual Differences,
42 (5), 815-24.
Boomsma,
A. (2000). Reporting Analyses of Covariance Structures. Structural Equation Modeling, 7 (3), 461-83
Hu, L.T.
and Bentler, P.M. (1999). Cutoff Criteria for Fit Indexes in Covariance
Structure Analysis: Conventional Criteria Versus New Alternatives. Structural Equation Modeling, 6 (1),
1-55.
Kline,
R.B. (2005). Principles and Practice of
Structural Equation Modeling (2nd Edition ed.). New York: The Guilford Press.
Mulaik,
S.A., James, L.R., Van Alstine, J., Bennet, N., Lind, S., and Stilwell, C.D.
(1989). Evaluation of Goodness-of-Fit Indices for Structural Equation Models. Psychological Bulletin, 105 (3),
430-45.