Untuk tahap ini akan membahas penggunaan R‐Commander untuk membuat statistik deskriptif dari suatu kumpulan data, khususnya pembuatan ringkasan (summary) data dan pembuatan tabel. Ringkasan data difokuskan pada pembuatan statistik deskriptif, yaitu ukuran‐ukuran pemusatan, penyebaran, kemiringan, keruncingan, dan lokasi daridata‐data numerik (metrik). Sedangkan pembuatan tabel difokuskan pada data‐data nonnumerik.
Paket R menyediakan beberapa fasilitas berkaitan dengan pembuatan ringkasan dari data numerik dan nonnumerik. Secara lengkap fasilitas yang berkaitan dengan ringkasan data
- Ringkasan numerik
- Distribusi Frekuensi
- Hitung observasi hilang
- Tabel statistika
- Matriks korelasi
- Uji korelasi
- Uji kenormalan Shapiro‐Wilk
1. Ringkasan Numerik (Summary)
Pada bagian ini akan dijelaskan cara perhitungan ringkasan deskriptif dari data dengan menggunakan berbagai metode statistika deskriptif. Secara umum ada dua macam data yang akan dibuat ringkasan numeriknya, yaitu data numerik (skala interval atau rasio) dan data kategorik (skala nominal atau ordinal). R menyediakan dua macam cara untuk menampilkan ringkasan numerik dari variabel‐variabel yang ada pada data, yaitu menampilkan ringkasan numerik dari semua variabel yang ada, dan menampilkan ringkasan numerik hanya dari variabel tertentu saja.
Perhitungan Ringkasan Numerik dari semua variabel dapat dilakukan dengan R Commander, yaitu gunakan menu Statistics, pilih Summaries, pilih Aktive Data set. Pada data numerik, ringkasan numerik akan menampilkan beberapa besaran statistik yaitu Mean, Min, Max, Kuartil 1, Median,dan Kuartil 3. Sedangkan pada data kategorik, ringkasan numerik hanya menampilkan jumlah atau frekuensi pada masing masing kategori yang ada.
Perhitungan Ringkasan Numerik khusus untuk variabel numrik dapat dilakukan dengan R‐Commander, yaitu gunakan menu Statistics, pilih Summaries, pilih Numerical summaries. Setelah itu akan terlihat jendela informasi tentang variabel metrik dari dataset yang akan ditampilkan ringkasan numeriknya
Misalkan akan dibuat ringkasan numerik untuk variabel Produksi , maka pada jendela dialog yang muncul, klik Produksi pada pilihan Peubah. Kemudian klik besaran‐besaran statistik yang akan ditampilkan ringkasannya. Setelah itu, klik OK untuk menampilkan output ringkasan numeriknya, sehingga diperoleh output pada jendela keluaran seperti berikut ini.
R juga menyediakan fasilitas untuk menampilkan ringkasan numerik dari variabel numerik berdasarkan group atau faktor tertentu. Misalkan akan dibuat ringkasan untuk variabel Produksi berdasarkan Pulau, maka gunakan menu Statistics, pilih Summaries, pilih Numerical summaries, dan isikan pilihan seperti sebelumnya, yaitu variabel Produksi pada pilihan Peubah yang muncul. Kemudian klik Summaries by Groups, dan pilih variabel Pulau dari daftar Peubah kelompok.
Selanjutnya klik OK, maka akan diperoleh output ringkasan numerik pada jendela keluaran seperti pada output berikut ini.
Dari output tersebut dapat dijelaskan bahwa rata‐rata Produksi jagung tertinggi berdasarkan pulau yaitu pulau jawa sedangkan yang terendah yaitu papua dan maluku.
2. Distribusi Frekuensi
Pembuatan Distribusi Frekuensi untuk variabel kategorik dapat dilakukan dengan R‐Commander, yaitu gunakan menu Statistics, pilih Summaries, pilih Frequency Distribution. Setelah itu akan terlihat jendela pilihan tentang variabel kategorik.
Misalkan akan dibuat distribusi frekuensi untuk variabel Pulau, maka pada jendela dialog pilihan variabel yang muncul, klik Pulau pada pilihan Peubah.Sebagai tambahan, pada menu pilihan Distribusi Frekuensi. ini dapat juga dilakukan Uji Kecocokan untuk mengevaluasi apakah probabilitas masing‐masing kategori sesuai dengan yang dihipotesakan. Misalkan akan diuji apakah persentase negara pada masing‐masing Pulau adalah sama, yaitu 1/6, maka pilih chi-square goodness of fit(hanya untuk satu peubah) sehingga diperoleh jendela pilihan probabilitas yang menjadi hipotesis seperti gambar berikut ini.
Klik OK untuk menampilkan output hasil pengujian, sehingga diperoleh output pada jendela keluaran seperti berikut ini.
Hasil tersebut menunjukkan bahwa nilai p‐value pengujian adalah 0.3337. Sehingga jika digunakan α=0.05 dapat disimpulkan bahwa pengujian menunjukkan gagal tolak H0. Hal ini dikarenakan nilai p‐value lebih besar dari α. Dengan demikian dapat disimpulkan bahwa proporsi negara di masing‐masing Pulau adalah sama yaitu 1/6.
3. Tabel Statistik
R juga menyediakan fasilitas untuk membuat ringkasan statistik dalam tabel untuk suatu variabel numerik (metrik) berdasarkan variabel nonmetrik (kategorik) atau faktor tertentu. Pada R‐Commander, gunakan menu Statistika, pilih Ringkasan, pilih Tabel statistika
Misalkan akan dibuat tabel statistika untuk variabel Produksi berdasarkan variabel Pulau, maka pada jendela dialog pilihan Faktor yang muncul, klik Produksi dan klik Pulau pada pilihan Peubah respon. Kemudian pilih besaran statistik yang akan ditampilkan pada tabel statistika yang akan dibuat. Setelah itu, klik OK untuk menampilkan output tabel statistikanya, sehingga diperoleh output pada jendela keluaran seperti berikut ini.
4. Matriks korelasi
Perhitungan Matriks Korelasi untuk variabel‐variabel metrik dan nonmetrik dapat dilakukan dengan R‐Commander, yaitu gunakan menu statistics, pilih Summaries, pilih Correlation matriks, Setelah itu akan terlihat jendela pilihan tentang variabelvariabel dari dataset yang akan ditampilkan matriks korelasinya seperti pada Gambar berikut ini.Misalkan akan dibuat matriks korelasi untuk variabel Luas lahan, Produksi dan Produktivitas, maka pada jendela dialog pilihan Peubah yang muncul, klik ketiga variabel tersebut. Kemudian pilih jenis korelasi (dalam kasus ini pilih Produk‐Momen Pearson) yang akan ditampilkan pada matriks korelasi yang akan dibuat. Setelah itu, klik OK untuk menampilkan output matriks korelasi, sehingga diperoleh output pada jendela keluaran seperti berikut ini.
5. Uji korelasi
Perhitungan Uji Korelasi, baik untuk korelasi Produk‐Momen Pearson ataupun korelasi Rank‐Order Spearman dapat dilakukan dengan R‐Commander, yaitu gunakan menu Statistics, pilih Summaries, pilih Correlation Matrix.Misalkan akan dilakukan pengujian korelasi untuk variabel Produksi dan Luas Panen, maka pada jendela dialog pilihan Peubah yang muncul, klik kedua variabel tersebut. Kemudian pilih jenis korelasi (dalam kasus ini pilih Produk‐Momen Pearson) yang akan diuji. Setelah itu, klik OK untuk menampilkan output pengujian pada jendela keluaran seperti berikut ini.
Hasil tersebut menunjukkan bahwa nilai p‐value pengujian adalah 2.2e‐16. Sehingga jika digunakan α=0.05 dapat disimpulkan bahwa pengujian menunjukkan tolak H0. Hal ini dikarenakan nilai p‐value lebih kecil dari α. Dengan demikian dapat disimpulkan bahwa ada korelasi positif antara Luas Panen dan Produksi.
Kalau ada kritik, saran dan pertanyaan silahkan komentarnya di kolom komentar di bawah. Kalau tidak punya akun silahkan ditulis sebelah kiri yaitu kolom “Chatbox”. Mohon dicantumkan email atau contact yang bisa dihubungi.
Sumber: Buku(Suhartono, 2008):Analisis Data statistik dengan R
Social Plugin