TRANSFORMASI DATA UNTUK MEMPEROLEH DATA BERDISTRIBUSI NORMAL

Bacaan Selanjutnya ...
Sebelumnya kita sudah bahas mengenai solusi data yang tidak berdistribusi normal. Salah satunya adalah transformasi data. Transformasi data adalah merubah skala data kedalam bentuk lain sehingga data memiliki distribusi yang diharapkan. Setiap data dilakukan operasi matematika yang sama pada data aslinya. Berarti kita merubah semua data untuk menjaga perbedaan antar data relatif tetap. Jika data kita memiliki lebih dari satu variabel, maka kita mentransformasikan semua variabel agar hubungan antar data tidak berubah.

Ada beberapa jenis transformasi data yang sering digunakan, diantaranya :

  • Transformasi kuadrat, berarti kita mengoperasikan pangkat dua data variabel. 
  • Transformasi kubik, berarti kita mengoperasikan pangkat tiga pada data variabel asli.
  • Transformasi akar, berarti kita mengoperasikan akar pada data variabel asli. Berguna untuk memperbaiki data yang terdistribusi positive skewness dan unequal variance (data tidak memenuhi asumsi kehomogenan). Dapat digunakan untuk data persentase, jika nilainya kebanyakan kecil maka sebaiknya gunakan transformasi akar.
  • Transformasi invers/ kebalikan, melakukan operasi balikan baik balikan pangkat atau pun tidak, seperti 1/x, 1/(x^2), dll.
  • Transformasi logaritma, berarti kita mengoperasikan data asli kebentuk logaritma. Digunakan untuk data yang terdistribusi Positive Skewness dan Unequal Variance. Ada beberapa hal yang perlu diperhatikan. Jika pada data asli menunjukkan nilai kurang dari 10 atau mendekati nol, maka gunakan log(X+1); jika data banyak mendekati nol seperti desimal, maka sebaiknya dikalian 10 lalu dilogaritmakan atau Log(10x).
  • Transformasi Arcsin, berarti kita mengoperasikan data asli kebentuk Arcsin (balikan sinus). Disebut juga transformasi Angular yang digunakan bila data dinyatakan dalam bentuk persentase atau proporsi. Biasanya memiliki sebaran Binomial. Ada beberapa hal yang perlu diperhatikan, Apabila data asli memiliki nilai antara 30%-70% maka tidak membutuhkan transformasi; bila memiliki nilai 0%-30% dan 70% -100% maka lakukan transformasi Arcsin dan bila banyak bernilai nol maka gunakan transformasi arcsin akar (%+0,5).
  • Transformasi invers skor, digunakan dalam data yang terdapat nilai negatif dan akan menggunakan transformasi berikutnya. Berguna untuk memperbaiki data yang terdistribusi Positive Skew dan Unequal Variance.
Pada umumnya untuk menentukan jenis transformasi mana yang paling tepat digunakan adalah dengan memplot data kita dan melihat trend dari data tersebut atau berdasarkan histogram dari data tersebut. Berikut adalah beberapa bentuk trend dari plot data/histogram :



Hal yang dapat dilakukan dari trend tersebut di atas adalah


Semoga Bermanfaat ^_^

Reference:
- Sugiyono. 2008. Metode Penelitian Bisnis. Alfabeta. Bandung.
- Sugiyono. 2009. Metode Penelitian Kuantitatif Kualitatif dan R & B. Bandung.
- Priyatno, Duwi. 2010. Paham Analisa Statistik Data dengan SPSS. Mediakom. Yogyakarta.
- Sugiyono, 2008. Statistik Nonparametris untuk Penelitian. Alfabeta. Bandung.
- Mendenhall, Sincinch. 1996. A Second Course In Statistics. Regression Analysis. Fifth Edition. Prentice Hall Internatiomal Edition.