pengolahan dan analisis data

Bacaan Selanjutnya ...

Pendahuluan
Pengolahan data adalah bagian dari rangkaian kegiatan penelitian setelah pengumpulan data. Pada tahap ini data mentah/raw data yang telah dikumpulkan diolah atau dianalisis sehingga menjadi informasi yang digunakan untuk menjawab pertanyaan penelitian.
Pengolahan data menggunakan teknik statistik dilakukan berdasarkan jenis variabel/data kategorik maupun numerik dapat dilakukan denga dua cara yaitu :

Secara manual dengan tangan menggunakan bantuan alat kalkulator.
Menggunakan komputer dengan aplikasi pengolahan data seperti Ms Excel, SPSS, Epi info, SAS Data Mining, Oracle data Mining dan lain sebagainya. Pengolahan data dalam penelitian kuantitatif dapat menggunakan aplikasi Maxqidata.

Langkah – langkah pengolahan data untuk kuesioner terbuka adalah :¹

Penyusunan data

Pada tahan ini peneliti memperhatikan apakah data yang diperlukan dan yang sudah dikumpulkan sesuai dengan tujuan penelitian dan untuk menguji hipotesis sudah lengkap. Hal-hal yang perlu diperhatikan dalam penyusunan data antara lain:

Memilih dan memasukan data yang diperlukan saja sesuai dengan tujuan penelitian
Memilih data yang objektif
Bila data yang dibutuhkan diperoleh dari teknik wawancara atau angket, maka harus dibedakan antara informasi yang dibutuhkan dengan kesan responden.

Klasifikasi data

Pada tahan ini peneliti melakukan pengelompokan data sesuai dengan kategori yang dibuat dalam definisi operasional sesuai dengan pertimbangan peneliti sendiri berdasarkan teori maupun penelitian sebelumnya.
Contoh :

Hipotesis penelitian:

Ada hubungan pengetahuan ibu tentang manfaat posyandu dengan kehadiran ibu dan bayi/balita di Posyandu.

Kalsifikasi Data:

Perilaku ibu ke posyandu (Ya/Tidak), Pengetahuan ibu tentang manfaat posyandu (Baik, cukup dan kurang).

Analisis data

Analisis data dapat dilakukan dengan cara manual atau dengan bantuan perangkat lunak komputer tergantung kemampuan peneliti dan kesulitan dalam pengolahan data. Bantuan perangkat lunak komputer paling sering digunakan karena sangat membantu peneliti mengolah data dan menghemat waktu. Hal yang harus duperhatikan adalah komputer tidak dapat memahami esensi penelitian kita, jadi peneliti harus secara benar dan teliti melakukan pengolahan data dengan baik dan benar mulai dari tahapan awal hingga akhir.

Pengolahan Data secara Manual

Pengolahan data secara manual sudah jarang digunakan, tetapi tetap digunakan pada keadaan dimana analisis data dengan bantuan perangkat lunak komputer tidak bisa digunakan misalnya tidak memiliki software tersebut, listrik mati dan tidak bisa menyalakan komputer di desa terpencil dan lain sebagainya.
Tahapan analisis data secara manual adalah sebagai berikut:¹

Editing / Penyuntingan data : data yang sudah diperoleh melalui wawancara dengan kuesioner atau alat ukur maupun teknik pengambilan data lainnya disunting apakah lengkap dan dapat menjawab pertanyaan penelitian dan atau memenuhi syarat untuk menguji hipotesis. Jika tidak lengkap, maka peneliti harus turun ke lapangan lagi dan melakukan pendataan ulang agar datanya lengkap.
Coding/membuat lembaran kode (coding sheet) atau kartu kode (coding sheet): lembaran atau kartu kode berupa format yang terdiri dari table yang dibuat sesuai dengan data yang diambil dari alat ukur yang digunakan. Contoh lembaran kode dapat dilihat pada tabel berikut ini.

Tabel 1. Lembaran Kode

Nomor Responden	Nomor Pertanyaan
Nomor Responden	1	2	3	4	Dst
001
002
003
004
005
006
dst

Sumber : Notoatmodjo (2010)¹

Table 2. Contoh Kartu Kode

1	2	3	4	5	6
7	8	9	10	11	12
13	14	15	16	17	18
19	20	21	22	23	24
25	26	27	28	29	30

Sumber : Notoatmodjo (2010)¹
Catatan:
Nomor adalah nomor pertanyaan masing-masing kotak (kolom) dengan kode-kode (huruf/angka) sesuai dengan jawaban masing-masing pertanyaan.

Data Entry : mengisi kolom dengan kode atau kartu kode sesuai dengan jawabanmasing-masing pertanyaan

Tabulasi data : yakni membuat tabel data, sesuai dengan tujuan penelitian atau yang diinginkan oleh peneliti.

Pengolahan Data dengan Komputer

Pengolahan data menggunakan perangkat lunak komputer biasanya terdiri dari beberapa tahap antara lain:^{1, 2}

Editing

Editing merupakan kegiatan untuk melakukan pengecekan isian formulir atau alat ukur penelitian yang kita gunakan. Adapun yang dilakukan pada tahap editing adalah mengecek:

Apakah semua pertanyaan / pernyataan telah terisi secara lengkap.
Apakah tulisannya cukup jelas terbaca
Apakah jawaban yang ditulis relevan dengan pertanyaan yang diberikan
Apakah jawaban responden konsisten antar pertanyaan. Misalnya pertanyaan usia dengan jumlah anak; usia reponden 18 tahun, dan jawaban jumlah anak 10 anak, jawaban tersebut tidak rasional dan tidak konsisten.

Coding

Coding merupakan kegiatan merubah data dalam bentuk huruf menjadi data dalam bentuk angka/bilangan. Sebagai contoh misalnya: data pendidikan yang dibagi menurut tingkat pendidikan SD-PT, kemudian di coding menjadi angka seperti angka 1=SD, 2=SLTP, 3=SLTA, 4=PT. Bentuk coding yang lain sesuai dengan pembagian tingkat pendidikan menurut UU misalnya: 1=Pendidikan Dasar (SD-SLTP), 2=Pendidikan Menengah (SLTA), 3=Pendidikan Tinggi (D1-D4, S1-S3).
Hal lain yang perlu diperhatikan dalam melakukan coding adalah konsistensi dalam menentukan kategori, misalnya angka terendah untuk hal yang kurang baik, angka lebih tinggi untuk hal yang baik. Contohnya variabel Pendidikan yang paling baik adalah dapat bersekolah setinggi mungkin, karena dengan menuntut ilmu pada tingkat pendidikan yang lebih tinggi memungkinkan seseorang lebih produktif, lebih bijaksana, mempunyai wawasan yang luas, pola pikir yang sistematik dan sistemik dan jejaring yang luas dan lain sebagainya, yang diperlukan pada era teknologi informasi dan komunikasi sekarang ini. Jadi coding yang dibuat adalah 1=Pendidikan dasar, 2=Pendidikan Menengah dan 3=Pendidikan Tinggi. Contoh lain untuk variable anemia adalah 1=Anemia positif (Hb < 10g%) dan 2=Tidak Anemia (Hb ³ 10gr%).

Entry

Pada tahap ini semua data yang telah di edit/sunting dan di coding atau semua data yang sudah lengkap dimasukan kedalam aplikasi komputer. Walaupun menggunakan program komputer, peneliti harus paham benar dengan penelitiannya karena program tersebut tidak memahami substansi yang diteliti, sehingga bisa saja hasilnya diperoleh, tetapi tidak sesuai dengan substansi yang ada. Misalnya hasil anaisis data yang didapatkan dengan bantuan perangkat lunak komputer: ada hubungan antara jenis kelamin dengan pemberian ASI Eksklusif, padahal yang memberikan ASI hanya ibu-ibu menyusui.

Processing

Langkah berikutnya adalah memproses data tersebut agar data yang sudah di entry dianalisis, agar dapat memperoleh jawaban terhadap pertanyaan penelitian, dan membuktikan apakah hipotesis yang sudah dirumuskan terbukti benar atau ditolak dari hasil analisis tersebut. Aplikasi komputer yang paling sering digunakan adalah program SPSS dibandingkan dengan aplikasi statistik lainnya. Langkah-langkah tersebut dapat dibaca pada manual dalam modul atau buku ajar yang tersedia dari berbagai sumber.

Cleaning

Cleaning data atau pembersihan data merupakan kegiatan pengecekan kembali data yang sudah dientri apakah sudah betul atau ada kesalahan pada saat memasukan data/entry data. Misalnya untuk variable Pendidikan hanya ada 3 (tiga) kategori yaitu 1=Pendidikan Dasar (SD-SLTP), 2=Pendidikan Menengah (SLTA), 3=Pendidikan Tinggi (D1-D4, S1-S3), tetapi setelah dicek ada kategori 4 (empat). Berikut akan diuraikan cara melakukan cleaning data. Tahapan cleaning data antara lain:

Mengetahui adanya missing data

Cara untuk mengetahui ada tidaknya missing data adalah dengan membuat list (distribusi frekuensi) dari variabel yang ada. Misalnya data yang diperoleh dari 100 responden, dengan variabel Kejadian Anemia dan Pendidikan. Contohnya dapat dilihat pada tabel dibawah ini.

Tabel 1. Distribusi Frekuensi Kejadian Anemia

Kejadian Anemia	Jumlah
Ya	30
Tidak	70
Jumlah	100

Berdasarkan tabel 1 di atas maka dapat diketahui tidak ada data yang missing karena dari 100 responden semuanya di entry dan di proses. Contoh lain dari variabel pendidikan dapat dilihat apada tabel 2 berikut ini.

Tabel 2. Distribusi Tingkat Pendidikan Responden

Tingkat Pendidikan	Jumlah
Dasar	30
Menengah	40
Tinggi	15
Jumlah	85

Berdasarkan tabel 2 di atas maka dapat diketahui bahwa ternyata dari 100 responden yang ada hanya ada 85 responden yang di entry dan di proses, sehingga ada 15 responden yang missing.

Mengetahui variasi data

Variasi data yang diketahui menungkinkan kita mengetahui apakah data yang sudah di entry benar atau salah. Caranya adalah membuat distribusi frekuensi masing-masing variabel. Misalnya variabel pendidikan dikategorikan sebagai berikut: 1=SD, 2=SLTP, 3=SLTA, 4=PT dengan jumlah responden 100 orang. Sebagai contoh variasi dapat dilihat pada tabel 3 berikut ini.
Tabel 3. Tingkat Pendidikan Responden

Tingkat Pendidikan	Jumlah
1	45
2	20
3	20
4	10
5	5
Jumlah	100

Dari table 3 di atas terlihat bahwa ada 5 kategori, sedangkan yang dibuat hanya 4 kategori (Tingkat Pendidikan 1 – 4).

Mengetahui Konsistensi Data

Untuk melihat konsistensi data dapat dilakukan dengan cara menghubungkan dua variabel. Contoh dapat dilihat pada tabel 4 dan 5 dengan menggunakan variabel anemia dan tingkat pendidikan.

Tabel 5. Distribusi Frekuensi Kejadian Anemia

Kejadian Anemia	Jumlah
Ya	30
Tidak	70
Jumlah	100

Tabel 6. Distribusi Tingkat Pendidikan Responden

Tingkat Pendidikan	Jumlah
Dasar	30
Menengah	40
Tinggi	10
Jumlah	80

Dari kedua tabel di atas dapat dilihat bahwa antara tabel 5 dan tabel 6 tidak konsisten dari jumlah responden. Total jumlah responden pada tabel 5 berjumlah 100 orang, sedangkan pada tabel 6 hanya 80 orang, jadi terdapat missing 20 responden.

Analisis dan Jenis Data

Pada analisis data, data mentah atau raw data yang telah diperoleh melalui wawancara, observasi dan metode pengumpulan data lainnya diolah untuk memperoleh informasi sesuai denga pertanyaan dan tujuan penelitian. Sebelum melakukan pengolahan data, maka jenis data harus diketahui terlebih dahulu, sehingga analisis data secara statistik dapat dilakukan dengan benar, menggunakan uji statistik yang tepat dan berbagai prosedur lainnya untuk memperoleh hasil analisis data yang akurat.
Data adalah kumpulan huruf atau kata, kalimat atau angka-angka yang dikumpulkan melalui proses pengumpulan data. Data tersebut merupakan sifat dan karakteristik dari variabel yang diteliti.¹
Variabel merupakan karakteristik yang nilai datanya bervariasi dari suatu pengukuran ke pengukuran berikutnya.³
Berdasarkan skala ukur, variabel terbagi menjadi empat jenis yaitu Nominal, Ordinal, Interval dan Ratio (NOIR) yang dapat dijelaskan sebagai berikut:^{1, 2, 3, 4, 5, 6, 7}

Nominal

Variabel hanya dapat membedakan nilai data, tidak ada tingkat nilai data tersebut. Contohnya jenis kelamin = laki-laki dan Perempuan, tidak ada tingkatan laki-laki lebih baik dari perempuan (kesetaraan gender), contoh lain adalah agama = Islam, Katolik, Kristen, Hindu, Budha, Konghucu, tidak ada tingkatan agama tertentu lebih baik dari agama lainnya.

Ordinal

Variabel yang mempunyai perbedaan nilai data dan tingkatan data (lebih tinggi atau rendah), tetapi belum diketahui besar perbedaan nilai antar keduanya. Contohnya tingkat pendidikan (SD, SLTP, SLTA, PT). Pendidikan SD lebih rendah tingkat pengetahuannya dibandingkan dengan tingkat Pendidikan Tinggi. Namun demikian, kita tidak dapat mengetahui secara pasti besar perbedaan pengetahuan seseorang dengan latar belakang pendidikan SD dibandingkan dengan seorang yang berpendidikan dari SLTP, SLTA dan PT.

Interval

Variabel interval dapat dibedakan, mempunyai tingkatan, dan besar perbedaan tingkat/jarak nilai variabel sudah diketahui, sedangkan kelipatan suatu nilai terhadap nilai lainnya tidak dapat diketahui. Contoh variabel suhu, misalnya benda A suhu 40°C dan benda B suhu 10°C. Benda A lebih panas dari benda B dan beda panas antara benda A dan benda B adalah 30°C, namun kita tidak bisa mengatakan bahwa benda A panasnya 4 kali lipat dari benda B. Jadi ini berarti bahwa variabel suhu tidak ada kelipatannya. Selanjutnya suatu benda jika suhunya 0°C, ini tidak berarti bahwa benda tersebut tidak mempunya panas, yang artinya variabel suhu tidak memiliki nilai nol mutlak.

Rasio

Merupakan variabel yang paling tinggi skalanya, mempunyai perbedaan, tingkatan, ada jarak dan juga kelipatan serta nilai nol mutlak. Contohnya variabel Berat Badan. Rensponden A mempunyai berat badan (BB) 30 kg, responden B mempunyai BB 60 kg. Jadi dapat dikatakan responden B mempunyai BB lebih berat dari responden A, renponden B memiliki BB 2 kali lebih berat dengan selisih berat badan 30 kg. Berat 0 kg berarti tidak mempunyai berat sama sekali sehingga ada nol mutlak.

Sedangkan untuk kepentingan analisis statistik, data/variabel terbagi menjadi dua jenis data yaitu data kategorik dan data numerik yang dapat dijelaskan sebagai berikut:²

Data Kategorik

Data kategorik atau disebut juga data kualitatif merupakan data yang sudah dikelompokan atau diklasifikasi. Ciri data kategorik berupa kata-kata. Contoh: Variabel jenis kelamin terdiri dari laki-laki dan perempuan, variabel agama terdiri dari Islam, Katolik, Kristen, Hindu, Budha dan Konghucu, serta variabel lainnya.

Data Numerik

Data numerik disebut juga data kuantitatif yang merupakan hasil dari perhitungan dan pengukuran. Ciri data kuantitatif adalah berbentuk angka. Data numerik dibagi menjadi data diskrit dan kontinyu.

(1) Data diskrit merupakan data hasil dari perhitungan seperti jumlah anak, jumlah pasien tiap hari.
(2) Data kontinyu merupakan hasil pengukuran seperti tekanan darah, Hb dan sebagainya.

Data/Variabel kategorik pada umumnya terdiri dari variabel dengan skala ukur nominal dan ordinal, sedangkan data/variabel numerik terdiri dari variabel dengan skala ukur interval dan rasio. Apakah data numerik dapat diubah menjadi data kategorik? Tentu saja bisa yaitu dengan melakukan pengelompokan atau diklasifikasi sesuai dengan acuan atau penelitian sebelumnya.
Contohnya: tekanan darah yang awalnya merupakan data numerik (kontinyu) dirubah menjadi data kategorik yang dikelompokan menjadi dua yaitu 1=hipertensi dan 2=tidak hipertensi. Pengelompokan ini berpatokan pada cut of point sesuai dengan teori yang ada, misalnya TD sistole > 130 mmHg dan diastole > 90 mmHg digolongkan hipertensi, atau dengan melihat kenaikan tekanan dari Sistole 30mmHg dan diastole 15 mmHg dari TD normal seseorang.

Prosedur atau Jenis Analisis Data

Prosedur atau tahap analisis data penelitian terbagi menjadi tiga tahap yaitu analisis univariat, analisis bivariat dan analisis multivariat. Analisis data yang dilakukan juga tergantung dari jenis penelitian, jenis sampel, jenis data/variable dan asumsi kenormalan distribusi suatu data. Dibawah ini akan dijelaskan masing-masing tahapan tesebut diatas.^{1, 2, 4}

Analisis Univariat

Analisis univariat digunakan pada penelitian diskriptif dan analitik. Analisis univariat bertujuan untuk menjelaskan karakteristik setiap variabel penelitian. Analisis univariat dilakukan menurut jenis data baik kategorik maupun numerik. Untuk data kategorik dapat berupa distribusi frekuensi : presentase dari setiap variabel yang diteliti.

Data Kategorik

Pada data kategorik, hasil akhir berupa distribusi frekuensi dengan ukuran persentase atau proporsi.
Contoh:

Desa A: Wanita Usia Subur yang menggunakan KB hormonal 50% dan Non-hormonal 50%
Desa B : Wanita Usia Subur yang menggunakan KB hormonal 90% dan Non-hormonal 10%

Pada Desa A, penggunaan KB bervariasi, sedangkan pada desa B, hanya 10% yang menggunakan KB non hormonal.
Contoh penyajian data kategorik dapat dilihat pada tabel 6 berikut ini.

Tabel 6. Distribusi Penggunaan KB Menurut Metode Kontrasepsi

Jenis Kontrasepsi	Jumlah	%
Pil	25	22.1
Suntikan	40	35.4
Susuk	10	8.8
IUD	15	13.3
MOW	10	8.8
MOP	5	4.4
Kondom	2	1.8
Alami	6	5.3
Jumlah	113	100

Data Numerik

Hasil akhir analisis data numerik pada tahap analisis univariat dapat berupa ukuran tengah dan ukuran variasi.

Ukuran tengah merupakan cerminan dari konsentrasi nilai-nilai hasil pengukuran. Berbagai ukuran dikembangkan untuk mencerminkan ukuran tengah tersebut. Ukuran tengah yang paling sering digunakan adalah mean, median dan modus.

(1) Mean / average adalah ukuran rata-rata yang merupakan hasil dari jumlah semua nilai pengukuran dibagi oleh banyaknya pengukuran. Rumusnya dapat dilihat di bawah ini.

Kelebihan nilai mean:

Mudah menghitungnya
Sudah melibatkan seluruh data dalam perhitungan

Kelemahan nilai mean:

Sangat dipengaruhi nilai ekstrim baik ekstrim tinggi maupun rendah.

Oleh karena itu pada kelompok data yang ada nilai ekstrim (distribusi data tidak normal) mean tidak digunakan karena tidak dapat mewakili rata-rata nilai pengamatan.
Contoh mengukur nilai mean:
5 ibu hamil melakukan kunjungan ANC masing – masing 4 kali, 5 kali, 7 kali, 12 kali dan 20 kali.
Mean = =18,6 dibulatkan 19
Jadi rata-rata/mean kunjungan ANC = 19 kali. Hasil ini tentunya tidak dapat mewakili karena ada nilai ekstrimnya.

(2) Median

Median adalah nilai dimana setengah banyaknya pengamatan mempunyai nilai di bawahnya dan setengahnya lagi mempunyai nilai di atasnya (nilai tengah). Berbeda dengan nilai mean, perhitunga median hanya mempertimbangkan urutan nilai dari pengukuran, besar beda antar nilai diabaikan. Karena besar bedatidak diperhitungkan maka nilai median tidak dipengaruhi oleh nilia ekstrim.

Prosedur memperoleh nilai median adalah:

Data diurutkan dari nilai kecil ke besar
Hitung posisi nilai median/tengah, rumusnya (n+1)/2
Hitung nilai mediannya.

Contoh menghitung nilai median:
BB lima orang ibu hamil (kg) : 46, 70, 53, 50, 61
Data diurutkan : 46, 50, 53, 61, 70
Posisi (5+1)/2=3
Mediannya adalah data yang urutannya ke 3 = 53.

Jika posisi diantara maka kedua nilai tersebut ditambahkan dan dibagi dua. Contohnya :
Data nilai Metlid enam mahasiswa : 70, 62, 100, 40, 88, 80
Data diurutkan : 40, 62, 70, 80, 88, 100
Posisi (6+1)/2 = 3,5
Median = (70+80)/2=75
Jadi 50% mahasiswa memperoleh nilai Metlid diatas 75 dan 50% memperoleh nilai Metlid kurang dari 75.

(3) Mode/Modus

Mode atau modus adalah data dengan nilai frekuensi terbanyak. Contoh: Kunjungan bayi ke Posyandu (kali) dalam setahun: 2,12,6,9,12,11,12,10,12,12,3
Dari data tersebut maka dapat disimpulkan mode/modus kunjungan bayi ke posyandu dalam setahun adalah 12.

Hubungan nilai Mean, Median dan Modus akan menentukan bentuk distribusi data:³

Jika nilai mean, median dan modus sama, biasanya distribusi datanya normal
Jika nilai mean > median > modus, maka distribusi datanya menceng/miring ke kanan.
Jika nilai mean < median < Modus, maka distribusi datanya menceng/miring ke kiri.

Ukuran Variasi

Nilai-nilai pengamatan cenderung akan berbeda satu dengan lainnya. Untuk mengetahui seberapa jauh variasi data digunakan ukuran variasi antara lain: range, jarak linier kuartil dan standar deviasi.

(1) Range

Range merupakan ukuran variasi yang paling besar, dihitung dari selisih nilai terbesar dengan nilai terkecil. Kelemahan range adalah dipengaruhi oleh nilai ekstrim. Keuntungan nilai range adalah perhitungan dapat dilakukan dengan cepat.
Contoh: umur lima orang mahasiswa non-regular tingkat satu : 18, 20, 18, 45, 30
Nilai terendah = 18, nilai tertinggi = 45
Range = nilai tertinggi dukurangi nilai terendah : 45-18= 27
Jadi range umur mahasiswa non regular tingkat satu adalah 27

(2) Jarak Inter Quartil

Jarak inter quartil adalah nilai observasi yang disusun secara berurutan mulai dari terkecil hingga terbesar, kemudian ditentukan kuartil bawah dan atas. Kuartil merupakan pembagian data menjadi empat bagian yang dibatasi oleh tiga ukuran kuartil I, kuartil II dan kuartil III.

Kuartil I mencakup 25% data berada di bawahnya dan 75% data berada di atasnya.
Kuartil II merupakan nilai median mencakup 50% data berada di bawahnya dan 50% data berada di atasnya.
Kuartil III mencakup 75% data berada di bawahnya dan 25% data berada di atasnya.

Jarak inter quartil adalah selisih antar kuartil III dan kuartil I. Ukuran ini lebih baik dari range, terutama kalau frekuensi pengamatan banyak dan distribusi sangat menyebar / tidak normal.

(3) Standar Deviasi

Variasi data yang diukur melalui penyimpangan/deviasi dari nilai-nilai pengamatan terhadap nilai mean-nya. Rata-rata hitung dari kuadrat deviasi terhadap mean disebut varian, yang rumusnya:
Semakin besar nilai varian akan semakin bervariasi, karena satuan varian (kuadrat) yang tidak sama dengan satuan nilai pengamatan. Dari kondisi tersebut maka dikembangkan suatu ukuran variasi yang mempunyai satuan yang sama dengan satuan pengamatan yaitu standar deviasi. Standar deviasi merupakan akar dari varian. Rumusnya:

Semakin besar SD, semakin besar variasinya, apabila tidak ada variasi, maka SD = 0.
Untuk data numerik digunakan nilai mean, median, standar deviasi dan inter quartil range (IQR), minimal (distribusi normal), maka perhitungan nilai mean dan standar deviasi merupakan cara analisis univariat yang tepat. Jika dijumpai nilai ekstrim (distribusi data tidak normal), maka nilai yang tepat untuk digunakan adalah nilai median, modus dan IQR.
Contoh penyajian data numerik dapat dilihat pada tabel 7 berikut ini.

Tabel 7. Distribusi Umur dan Lama Hari Rawat Pasien di RS X Tahun 2015

Variabel	Mean	Median	SD	Minimal -Maksimal
Umur	30,2	31,1	10,1	12 – 60
Lama Hari Rawat	10,1	17,0	8,9	2 – 60

Sumber : Hastono (2007)²

Analisis Bivariat

Analisis bivariat adalah analisis statistik yang dilakukan untuk menguji hipotesis antara dua variabel, untuk memperoleh jawaban apakah kedua variabel tersebut ada hubungan, berkorelasi, ada perbedaan, ada pengaruh dan sebagainya sesuai dengan hipotesis yang telah dirumuskan. Adapun tahapan dalam analisis bivariat adalah:¹

Analisis proporsi atau presentase dengan membandingkan distribusi silang antara dua variabel yang bersangkutan.
Hasil analisis dari uji statistik (chi square test, Z test, t test, Pearson, dsb) dapat disimpulkan ada / tidaknya hubungan, korelasi, perbedaan antara kedua variabel tersebut. Bisa saja terjadi secara persentase berhubungan tetapi hasil uji statistik tidak bermakna.
Analisis keeratan hubungan antara kedua variabel tersebut dengan melihat Odd Ratio (OR). Besar kecilnya nilai OR menunjukan seberapa erat hubungan kedua variabel, demikian juga rentang OR dibawah angka 1 = faktor protektif dan > 1 = sebagai faktor risiko.

Contoh tabel analisis bivariat pada analisis data kategorik menggunakan uji chi square dapat dilihat pada table 8 berikut ini.

Tabel 8. Hubungan Konsumsi Tablet Fe dan Kejadian Perdarahan Post Partum

Konsumsi Tablet Fe	Perdarahan Post Partum		Total	Nilai P	OR(IK 95%)
	Ya	Tidak
Ya	7 (20%)	28 (80%)	35 (100%)	0,004	3,08 (1,2 –6,7)
Tidak	24 (54%)	20 (45,5%)	44 (100%)
Total	31 (39,2%)	48 (60,8%)	79 (100%)

Sumber : Modifikasi dari Notoatmojo (2010)¹
Interpretasi:
Dari tabel diatas menunjukan bahwa dari 35 responden yang mengkonsumsi tablet Fe terdapat 20% yang mengalami perdarahan post partum, sedangkan dari 44 responden yang tidak mengkonsumsi tablet Fe lebih banyak yang mengalami perdarahan postpartum yakni sebesar 54%. Hasil uji statistik menunjukan nilai P 0,004 (< 0,05) yang berarti ada hubungan yang bermakna mengkonsumsi tablet FE dengan perdarahan post partum. OR (CI 95%) = 3,08 (1,2 – 6,7) artinya responden yang tidak mengkonsumsi tablet Fe selama hamil beresiko mengalami perdarahan post partum 3,08 kali lebih besar dibandingkan dengan responden yang mengkonsumsi tablet Fe.
Perlu dipahami bahwa meskipun secara statistik ditemukan ada hubungan secara bermakna antara kedua variabel, tidak menjamin kemungkinan bermakna pula secara klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis akan semakin besar menghasilkan kemungkinan berbeda / berhubungan secara bermakna. Dengan sampel besar perbedaan – perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai manfaat secara substansi / klinis dapat berubah menjadi bermakna secara statistik. Dengan demikian peneliti yang melakukan analisis hendaknya jangan hanya melihat dari sudut pandang statistik saja, tetapi harus juga melihat dari segi kegunaan atau manfaat dari sisi klinis juga. ^{2, 4}

Analisis Multivariat

Analisis multivariat digunakan untuk mengetahui dari sekian variabel independen yang ada, manakah yang paling dominan hubungannya atau pengaruhnya terhadap variable dependen. Pada analisis dilakukan berbagai langkah pembuatan model. Model terakhir terjadi apabila semua variabel independen dengan dependen sudah tidak mempunyai nilai p > 0,05. Berikut ini adalah contoh pemodelan awal dan akhir dari sebuah analisis multivariat.

Tabel 9. Model Awal Regresi Logistik Ganda antara Variabel Bebas dan Perancu dengan Pemberian ASI Eksklusif

Variabel	Koefsien (β)	SE	Nilai p	OR	IK 95 % (OR)
Frekuensi Pemeriksaan Kehamilan	1,530	0,422	0,000	4,61	2,02-10,55*
Konseling Laktasi	-0,172	0,453	0,705	0,84	0,34-2,04
Pengetahuan	1,476	0,458	0,001	4,37	1,78-10,73*
Pendidikan	0,147	0,500	0,769	1,15	0,43-3,08
Pekerjaan	-0,501	0,692	0,469	0,60	0,15-2,35
Paritas	0,715	0,421	0,090	0,04	0,89-4,66*
Tingkat Pendapatan Keluarga	0,142	0,416	0,733	1,15	0,51-2,60

* Signifikan
Berdasarkan tabel 9 di atas diperoleh bahwa diantara 7 variabel, hanya 3 variabel yang akan masuk ke dalam model yaitu frekuensi pemeriksaan kehamilan, pengetahuan dan paritas. Selanjutnya semua variabel yang masuk dalam model dianalisis secara bersama-sama. Variabel kandidat dimasukkan ke dalam model, kemudian variabel yang nilai p-nya tidak signifikan (p>0,05) dikeluarkan dari model secara berurutan dimulai dari variabel dengan nilai p terbesar. Apabila setelah dikeluarkan diperoleh selisih OR variabel utama (frekuensi pemeriksaan kehamilan) antara sebelum dan sesudah variabel kovariat dikeluarkan lebih besar dari 10%, maka variabel tersebut dinyatakan sebagai perancu dan tetap berada dalam model.
Dari hasil analisis multivariabel dengan menggunakan analisis logistik ganda ternyata pengetahuan dan frekuensi pemeriksaan kehamilan merupakan faktor risiko utama pemberian ASI eksklusif (Tabel 10).
Tabel 10. Model Akhir Regresi Logistik Ganda antara Variabel Bebas dan Perancu dengan Pemberian ASI Eksklusif

Variabel	Koefisien (β)	SE (B)	Nilai p	OR	IK 95% (OR)
Pengetahuan	1,459	0,394	0,00	4,30	1,98-9,31*
Frekuensi Pemeriksaan Kehamilan	1,455	0,404	0,00	4,28	1,93-9,46

Berdasarkan tabel 10 terlihat bahwa OR pengetahuan yang paling besar nilainya. Dengan demikian di antara variabel yang memiliki hubungan dengan pemberian ASI eksklusif, variabel pengetahuan merupakan variabel yang paling berhubungan. Artinya pengetahuan ibu tentang ASI eksklusif yang baik akan meningkatkan pemberian ASI eksklusif sebanyak 4 kali. Demikian juga pemeriksaan kehamilan yang lebih sering akan meningkatkan pemberian ASI eksklusif sebanyak 4 kali.
Perlu dipahami bahwa meskipun secara statistik ditemukan ada hubungan secara bermakna antara kedua variabel, tidak menjamin kemungkinan bermakna pula secara klinis. Seperti diketahui bahwa semakin besar sampel yang dianalisis akan semakin besar menghasilkan kemungkinan berbeda / berhubungan secara bermakna. Dengan sampel besar perbedaan – perbedaan sangat kecil, yang sedikit atau bahkan tidak mempunyai manfaat secara substansi / klinis dapat berubah menjadi bermakna secara statistik. Dengan demikian peneliti yang melakukan analisis hendaknya jangan hanya melihat dari sudut pandang statistik saja, tetapi harus juga melihat dari segi kegunaan atau manfaat dari sisi klinis juga. ^{2, 4}

Daftar Pustaka

Notoatmodjo S. Metode Penelitian Kesehatan. Jakarta Rineka Cipta; 2010.
Hastono SP. Analisis Data Kesehatan, Basic Data Analysis for Health Research Training. Depok: Universitas Indonesia; 2007.
Hastono SP, Sabri L. Statistik Kesehatan. Jakarta: Rajawali Pers; 2006.
Dahlan S. Statistik untuk Kedokteran dan Kesehatan. Jakarta: Sagung Seto; 2011.
Sastroasmoro S, Ismael S. Dasar-Dasar Metodologi Penelitian Klinis. Jakarta: Sagung Seto; 2011.
Riyanto A. Aplikasi Metodologi Penelitian Kesehatan; Dilengkapi COntoh kuesioner dan Laporan Penelitian. Yogyakarta: Nuha Medika; 2011.
Satari MH, Wirakusumah FF. Konsistensi Penelitian. Bandung: Refika Aditama; 2011.