Tulisan ini akan membahas beberapa analisis statistik dasar
yang dapat digunakan dalam RStudio, seperti analisis deskriptif dari data yang
kita miliki. Pada tulisan sebelumnya
kita telah mempelajari bagaimana cara mengimpor data dari file CVS, excel, dan
SPSS. Data yang telah kita impor tersebut kita gunakan untuk analisis
selanjutnya. Untuk memanggil kembali data kita, ketikkan kembali script setwd("C:/Users/Hanif/Google Drive/BLOGSPOT/UNTUK DIDOWNLOAD") dan perilakucsv<-read.csv("perilaku merokok.csv",header=TRUE,sep = ";") lalu kita run. Maka akan muncul data perilakucsv. Script silakan disesuaikan dengan nama file anda dan tempat menyimpan file tersebut. Jangan lupa untuk mengubah tanda back-slash (\) menjadi tanda slash (/) untuk menunjukkan lokasi file. Data ini yang akan kita gunakan di analisis selanjutnya. Data dapat didownload di sini
Melihat struktur
data kita
Untuk melihat struktur data kita dan variabel apa saja
yang ada di data kita, kita bisa mengetikkan script str(file). Sebagai contoh, pada file
tersebut kita bisa mengetik str(perilakucsv), lalu tekan run atau ctrl+enter. Maka akan muncul tampilan di console tekan run atau
ctrl+enter. Maka akan muncul tampilan di console nama variabel beserta jenisnya
apakah itu factor atau angka.
Melihat Data Awal
dan Akhir
Kita juga dapat meilhat data teratas dan terbawah. Untuk melihat
data teratas, ketik script head(nama file). Sebagai contoh untuk data di atas,
ketik head(perilakucsv), lalu run. Maka akan keluar enam data paling atas kita. Sedangkan untuk
melihat enam data paling akhir, ketikan script tail(perilakucsv),
lalu tekan run.
Melihat Rangkuman
Statistik Data
Untuk melihat rangkuman statistik data kita, ketik summary(perilakucsv) pada script editor, lalu tekan run atau ctrl+enter. Maka
akan muncul rangkuman statistik masing-masing variabel data kita mulai dari
min, max, mean, median, dan mean. Jika kita menghendaki haya variabel tertentu
yang ditampilkan rangkuman statistiknya, maka beri tanda dolar ($) diikuti nama
variabel. Misal untuk melihat rangkuman statistik variabel perilaku ketik summary(perilakucsv$PERILAKU), lalu run.
Melihat Standar Deviasi
Untuk melihat standar deviasi salah satu variabel kita,
ketikan sd(variabel). Misal kita ingin melihat standar deviasi variabel
perilaku, maka ketik sd(perilakucsv$PERILAKU), lalu klik run.
Melihat Frekuensi
dan Persentase Data Kategorikal
Terkadang kita membutuhkan data frekuensi dan persentase
dari data kategorikal kita. Misalkan berapa persen subjek tinggal di desa A,
berapa persen subjek tinggal di desa B. Untuk melihat jumlah frekuensi dan
membuat tabel baru dengan data tersebut, kita bisa memakai script table(nama file)->nama baru. Misalkan kita akan melihat
frekuensi alamat subjek dan membuat tabel baru dengan nama f.alamat, maka kita
ketik script table(perilakucsv$Alamat)->f.alamat, lalu
tekan run. Maka di environment kita
sudah ada value baru yaitu f.alamat. kemudian untuk melihat isi f.alamat, ketik
f.alamat lalu run. Maka akan muncul frekuensi dari alamat, yakni purbonegaran 64
dan terban 40. Untuk melihat presentase alamat tersebut, kita dapat menggunakan
scrip prop.table(f.alamat), lalu run. Maka akan muncul purbonegaran 61,9%
dan terban 38,1%.
EmoticonEmoticon