Thursday, July 12, 2018

Perlunya Melakukan Uji Linearitas dan Cara Mengatasi Data Tidak Linear

Dalam beberapa analisis statistik parametrik, seperti korelasi pearson dan analisis regresi, salah satu asumsi yang mendasari analisis adalah hubungan antar variabel membentuk pola (model) yang linear. Model linear artinya pola hubungan kedua variabel independen dan dependen akan membentuk satu garis lurus. Beberapa pendapat muncul terkait perlu tidaknya kita menguji asumsi linearitas ini terlebuh dahulu sebelum melakukan uji hipotesis. Pendapat ini wajar saja, karena memang uji hipotesis, dengan korelasi pearson misalnya, mendasarkan hubungannya harus linear, jadi ketika hasil korelasi signifikan, sudah dipastikan asumsi linearitas juga terpenuhi. Jadi menguji asumsi linearitas di awal adalah sesuatu yang mubazir.

Namun pada kenyataannya, tidak semua variabel Psikologi di dunia ini hubungannya linear. Ada yang membentuk kurve. Seperti hubungan antara uang dan kebahagiaan, pada tingkatan rendah, uang memang akan dapat meningkatkan kebahagiaan. Tapi pada satu titik tertentu, peningkatan uang tidak terlalu berpengaruh lagi terhadap peningkatan kebahagiaan. Tetapi tetap kita harus akui, ada hubungan antara uang dan kebahagiaan, meskipun pola hubungannya tidak linear sempurna. Di sini saya akan menyajikan contoh penelitian yang dapat menjelaskan perlunya kita melihat linearitas hubungan dan apa pengaruhnya terhadap penyimulan statistik kita.


Contoh penelitian
Berikut ini adalah penelitian fiktif dengan data fiktif yang dapat memberi gambaran bahwa tidak semua hubungan antar variabel di muka bumi ini linear.

Variabel dependen      : Performa kerja
Variabel independen   : Stress kerja
Hipotesis                     : Stress kerja berhubungan dengan performa kerja. Semakin tinggi stress kerja, maka semakin rendah performa kerja.

Penelitian ini jelas dasarnya, bahwa stress yang dirasakan pegawai justru dapat membuat performa pegawai menurun. Oleh karena itu beberapa perusahaan berusaha menciptakan lingkungan kerja yang menyenangkan agar pegawai tidak stress, sehingga performanya akan meningkat.

Setelah dilakukan uji hipotesis dengan analisis korelasi Pearson, ternyata hasilnya seperti ini.

Correlations

Stres
Performa
Stres
Pearson Correlation
1
,103
Sig. (2-tailed)

,353
N
83
83
Performa
Pearson Correlation
,103
1
Sig. (2-tailed)
,353

N
83
83

Hubungan antara stress dan performa tidak signifikan (p > 0,05). Padahal dari hasil kajian teori kita sudah sangat yakin bahwa stress berhubungan kuat denga performa kerja. Alat ukur yang digunakan juga sudah valid dan reliabel. Lalu apa yang salah dengan hasil uji hipotesis kita? Kenapa dikatakan tidak ada hubungan?

Uji Asumsi Linearitas
Di saat seperti inilah verifikasi asumsi linearitas itu diperlukan. Apakah hubungan yang ada antara stress dan performa ini membentuk hubungan yang linear? Atau justru membentuk pola yang lain. Untuk melakukan uji linearitas di SPSS kita dapat melakukan prosedur ini.
1.    Analyze – compare means – means
2.    Masukkan variabel performa ke dependent list, dan variabel stress ke independent list
3.    Klik options – centang test for linearitycontinue
4.    Ok

ANOVA Table

Sum of Squares
df
Mean Square
F
Sig.
Performa * Stres
Between Groups
(Combined)
594,077
39
15,233
143,958
,000
Linearity
6,389
1
6,389
60,381
,000
Deviation from Linearity
587,687
38
15,465
146,157
,000
Within Groups
4,550
43
,106


Total
598,627
82




Pada tabel ANOVA kita bisa memverifikasi linearitas itu pada bagian linearity dan Deviation from linearity. Ada dua pendapat memang. Linearity ini menggambarkan apakah model linear dapat menjelaskan dengan baik hubungan antar variabel. Jika linearity signifikan (p<0,05), maka itu berarti hubungan antar variabel dapat dijelaskan menggunakan model linear. Deviation from linearity menunjukkan penyimpangan dari pola linear. Jika penyimpangan ini signifikan (sig < 0,05), itu artinya data kita tidak linear. Namun jika penyimpangan ini tidak signifikan (sig > 0,05), itu menunjukkan tidak ada perbedaan data kita dengan data linear ideal, dengan demikian kita dapat menyataka data kita linear. Dari output di atas kita bisa lihat,  nilai F linarity sebesar 143,958 (p<0,05), dengan demikian dapat dikatakan model linear dapat menjelaskan dengan baik hubungan antar variabel. Tapi kalau kita lihat nilai F deviation from linearity sebesar 146,15 (p < 0,05), menunjukkan model linear mengenai hubungan antar variabel akan memberikan informasi yang kurang lengkap. Sehingga diperlukan uji model non-linear pada data kita. Ini dilakukan untuk melihat manakah model yang terbaik menjelaskan pola hubungan ini. Oleh karena itu wajarlah bila hasil uji korelasi pearson kita tidak signifikan, karena memang pola hubungan linear hanya memberikan sedikit informasi. Padahal korelasi pearson sendiri menghendak hubungan yang linear.

Melihat Pola Hubungan Antar Variabel
Untuk melihat pola hubungan apa yang tepat diterapkan pada data kita, kita bisa cek dengan prosedur ini.
1.    Klik analyze – regression – curve estimation
2.    Masukkan performa ke kotak dependent dan stress ke kotak independent
3.    Centang model linear, Quadratic, dan S
4.    Ok

Model Summary and Parameter Estimates
Dependent Variable:   Performa 
Equation
Model Summary
Parameter Estimates
R Square
F
df1
df2
Sig.
Constant
b1
b2
Linear
,011
,874
1
81
,353
4,816
,027

Quadratic
,867
260,450
2
80
,000
-14,692
1,463
-,023
S
,209
21,410
1
81
,000
2,196
-17,832

The independent variable is Stres.

Tabel Model Summary and Parameter estimates menunjukkan model mana yang tepat untuk menganalisis data kita. Ketiga model ini adalah yang paling umum, meskipun masih ada kemungkinan model yang lain. Dari nilai R square pada tabel terlihat bahwa model yang paling tepat adalah model Quadratic karena memiliki R square paling tinggi diantara semua pola. Jika menggunakan model kudratik kita akan mendapatkan sumbangan efektif sebesar 86,7%, sedangkan kalau menggunakan model linear hanya menghasilkan 1,1%.

 Gambar di atas menunjukkan bahwa model Quadratic hampir menyamai pola hubungan antra stress dengan performa. Pada stress tingkat rendah, semakin tinggi stress jsutru semakin tinggi performa. Namun pada tingkat stress tinggi, semakin tinggi stress semakin rendah performa. Secara teoritis hal ini bisa masuk akal karena jika stress kerja terlalu rendah, justru pegawai tidak termotivasi dan berakibat rendahnya performa.

Jika melihat pola hubungan di atas, nampaklah bahwa sebenarnya ada hubungan antara stress dengan performa kerja. Meskipun demikian pola hubungan yang terjadi tidak linear, namun membentuk pola kuadratik. Lalu bagaimana cara mengatasinya. Ada beberapa teknik analisis ya bisa digunakan, tapi pada kasus di atas, cara paling sederhana adalah dengan membagi data menjadi dua kelompok dan dianalisis secara terpisah. Kedua kelompok yang dimaksud adalah kelompok yang memiliki tingkat stress rendah (di bawah mean) dan kelompok yang memiliki tingkat stress tinggi (di atas mean).

Membagi Dua Kelompok
Untuk melihat nilai mean yang akan kita gunakan sebagai batas pemisah kelompok stress rendah dan stress tinggi, kita bisa lihat di statistik descriptif. Caranya adalah
1.    Klik analyze – descriptive statistics – descriptives
2.    Masukkan stress ke variables
3.    Ok

Dari output, kita tahu bahwa meannya adalah 33,96.

Sekarang kita akan bagi data menjadi dua kelompok, yakni adalah kelompok yang memiliki tingkat stress rendah (di bawah mean) dan kelompok yang memiliki tingkat stress tinggi (di atas mean). Caranya adalah:
1.    Transform – recode into different variables
2.    Masukkan variabel stress pada menu Numeric
3.    Di output variables, pada kolom name tulis nama variabel baru sebagai nama variabel kita. Misal dalam contoh ini saya beri nama kat_stress, lalu klik change
4.    Klik Old and New Variables
5.    Pada menu selanjutnya klik Range, Lowest through value, isi dengan angka 33,96. Pada New Value, tulis angka 1, lalu klik Add
6.    Setelah kategori pertama masuk, kita klik Range, value through highest. Isi dengan angka 33,96, lalu pada kotak New Value tulis 2 dan klik Add.
7.    Klik Continue, lalu OK. Variabel kat_stress akan muncul pada data

Menganalisis Korelasi Masing-masing kelompok
Dalam data baru kita, ada variabel baru yang muncul, yakni kat_stress yang menunjukkan kelompok stress. Nilai 1 menunjukkan kelompok rendah, dan nilai 2 menunjukkan kelompok tinggi.

Untuk menganalisis pada masing-masing kelompok pada SPSS, kita gunakan menu split file. Caranya adalah:
1.    Klik data – split file
2.    Pilih compare group
3.    Masukkan variabel kat_stress
4.    Ok

Setelah itu kita bisa mengkorelasikan seerti biasa dengan korelasi pearson. Caranya adalah:
1.    Klik analyzecorrelatebivariate
2.    Masukkan variabel stress dan performa
3.    Ok
Maka akan muncul output seperti ini

Correlations
kat_stress
Stres
Performa
1,00
Stres
Pearson Correlation
1
,991**
Sig. (2-tailed)

,000
N
32
32
Performa
Pearson Correlation
,991**
1
Sig. (2-tailed)
,000

N
32
32
2,00
Stres
Pearson Correlation
1
-,986**
Sig. (2-tailed)

,000
N
51
51
Performa
Pearson Correlation
-,986**
1
Sig. (2-tailed)
,000

N
51
51
**. Correlation is significant at the 0.01 level (2-tailed).

Output di atas dibedakan berdasarkan kelompok stress (kat_stress). Pada kat_stress 1 (kelompok rendah), stress berkorelasi positif secara signifikan dengan performa (p<0,01) dengan r = 0,991. Sedangkan pada kat_stress 2 (kelompok tinggi), stress berkorelasi negatif secara signifikan dengan performa (p<0,01) dengan nilai r = -0,986. Dari hasil tersebut nampaklah bahwa sebenarnya ada hubungan antara stress dengan performa kerja. Pada stress tingkat rendah, semakin tinggi stress jsutru semakin tinggi performa. Namun pada tingkat stress tinggi, semakin tinggi stress semakin rendah performa.

Dari penjelasan di atas, nampaklah bahwa verifikasi asumsi linearitas penting untuk dilakukan jika uji hipotesis kita yang menyatakan ada hubungan antar variabel ternyata tidak terbukti, padahal teori yang digunakan sudah kuat. Varifikasi uji asumsi perlu dilakukan untuk melihat apakah bola hubungan yang terjadi sifatnya linear atau bentuk hubungan yang lain, seperti kuadratik seperti pada contoh di atas. Dengan demikian analisisnya pun bisa mengikuti, yakni dengan membagi analisis pada beberapa bagian.


NOTE: data yang digunakan untuk simulasi ini adalah fiktif, jadi memang dibuat too good to be true, dan koefisien korelasinya bisa sangat tinggi seperti itu. Dalam dunia nyata mungkin hal ini jarag terjadi.

17 comments:

  1. Maaf, saya seorang mahasiswi dan sedang mengerjakan skripsi, saya menggunakan uji hipotesis korelasi product moment dan uji linearitas regresi sederhana, saat pengujian linearitasnya tidak linear tetapi keberartian regresinya berarti, lalu saya harus bagaimana? Tetap melanjutkan jika data tidak linear atau menggantinya?

    ReplyDelete
    Replies
    1. Bisa melanjutkan tnpa uji linear,atw cb pemotongan data..kalau mentok sdh tdk bisa klo datany kuesioner bs disesuaikan atw perlakuan khusus..


      Call us zaf konsultan statistik www.zafolahdata.com

      Delete
  2. This comment has been removed by the author.

    ReplyDelete
  3. Pak, saya mencoba melakukan uni linearitas dengan data 5N, tetapi waktu saya uji linearitas yabel annova nya tidak kebaca, mohon bantuannya pak apakah masih bisa di uji pakai linearitas atau nggak?

    ReplyDelete
  4. Pak kalau penelitian saya judulnya tentang pengaruh kualitas pelayanan terhadap loyalitas konsumen apakah membutuhkan uji liniearitas ?

    ReplyDelete
  5. pak, saya mahasiswa yang sedang mengerjakan skripsi saat ini. saya menggunakan PLS serta uji asumsi klasik. tapi saat uji linearitas, semua data saya sig < 0.05 yang menunjukkan data tidak linear. apa yang harus dilakukan. terimakasih sebelumnya

    ReplyDelete
    Replies
    1. Assalamualaikum pak.saya mahasiswa saya sedang menyelesaikan skripsi saya .tpi saya terhambat pas uji linieritas nya pak .karena uji linearitas <0.05
      Karena judul saya pengaruh stres kerja terhadap kinerja pegawai
      Gimana solusi nya pak

      Delete
    2. Kak infoin jawabannya yaa.. aku juga lagi mengalami hal yang sama 😭

      Delete
  6. Tolong di respon pak .🙏🙏

    ReplyDelete
  7. Pak setelah di ikuti step dari bapak ..apakah kita ulang lagi validitas dan reliabilitas yg. Dgn uji2 yang lain

    ReplyDelete
  8. bapak, mau tanya soal data yang tidak linier. bagaimana cara singkat untuk mengubah jadi linier??
    mohon sarannya, Terimakasih

    ReplyDelete
  9. Assalamualaikum pak mau tanya kalau kita uji linieritas pakai data yang sudah ditransform gimana pak

    ReplyDelete
  10. Selamat siang Pak, saya mau bertanya, saya melakukan analisis regresi linier berganda. Lalu saat uji normalitas data, hasilnya normal, tetapi saat uji linier malah jadi tidak linier.. Bagaimana ya pak??

    ReplyDelete
  11. Pak saya kan lagi melakukan uji perason. Nilai corelasi dan sig nya tidak berhubungan. Tapi ketika saya analisis regresi linear berganda malah berhubungan.

    ReplyDelete
  12. Permisi pak izin bertanya, untuk uji linearitas saya angka signifikansi nya dibawah 0,05, apakah ada pendapat ahli yang menyatakan bahwa untuk nilai signifikansi dibawah 0,05 masih bisa dilanjutkan pak? terimakasih

    ReplyDelete
  13. Ijin pak. Saya mau bertanya ketika saya melakukan uji linear sbb:
    1. Pengujian linear Variabel X1 dan Y dengan hasil dimana taraf signifikan 0,000 < 0,05 makan di nyatakan linear

    2 pada pengujian linear varabel X2 dan Y dimana hasil traf signifikan yang 0.325 > 0,05 maka dinyakan tidak liner apakah ini tidak bermasalah pak.

    ReplyDelete