P EN D AH U LU A N
P
ada modul ini Anda dapat mempelajari pokok bahasan "pengolahan
data". Ada beberapa sub-pokok bahasan yang akan disajikan, yaitu
mempersiapkan data termasuk memeriksa kelengkapan data dan kebersihan
data, pengkodean (coding), penyajian singkat tentang statistik deskriptif dan
statistik inferensi, dan penyajian data. Oleh karena itu, setelah mempelajari
modul ini Anda diharapkan dapat:
1. memeriksa kelengkapan dan kebersihan data;
2. melakukan pengkodean dan penyajian data;
3. menjelaskan perbedaan statistika deskriptif dan inferensi; serta
4. menyajikan data yang informatif dan mudah dimengerti oleh pembaca.
Metodologi Penelitian
Kegiatan Belajar 1
S
ebelum melakukan analisis data Anda harus melakukan beberapa hal,
antara lain mempersiapkan data. Dalam mempersiapkan data tersebut
yang pertama sekali Anda lakukan adalah memeriksa kelengkapan data.
Seandainya Anda langsung memasukkan data Anda ke komputer kemudian
Anda menemukan bahwa data yang Anda masukkan ternyata masih belum
lengkap maka pekerjaan untuk data tersebut akan sia-sia. Kalau data Anda
sudah lengkap maka Anda sudah siap memasukkannya ke komputer. Adapun
langkah-langkah yang dapat Anda jalankan akan dijelaskan berikut ini.
1.
Memeriksa Kelengkapan dan Kebersihan Data
Setelah Anda berhasil mengumpulkan data (dari kuesioner ataupun
pengamatan laboratorium) maka data tersebut harus Anda periksa dulu. Pada
umumnya data dari kuesioner banyak tidak lengkap isinya. Sering kali juga,
ada responden yang menjawab kuesioner asal isi saja. Hal ini dapat dilihat
pada pertanyaan-pertanyaan yang sifatnya paralel di mana isinya sangat
berlawanan. Data seperti ini kalau Anda olah akan membuat kesimpulan
yang nantinya akan Anda buat menjadi salah. Kalau Anda menemukan isian
kuesioner seperti itu, sebaiknya kuesioner tersebut Anda singkirkan saja
(tetapi syaratnya alat ukur yang Anda gunakan sudah melalui tahapantahapan pembuatan kuesioner yang benar). Tetapi dalam hal responden tidak
menjawab pertanyaan pada kuesioner maka kuesioner tersebut jangan Anda
buang, sebab informasi lainnya yang mungkin Anda butuhkan ada pada
kuesioner itu.
Pada teknik pengolahan data nanti, data yang tidak diisi bisa tidak
diperhitungkan oleh perangkat lunak yang ada. Satu hal yang harus Anda
ingat ialah jangan sekali-kali mengubah data yang sudah didapat. Karena hal
ini merupakan penipuan. Oleh karena itu, sebelum mengumpulkan data,
Anda harus betul-betul yakin bahwa instrumen yang Anda gunakan
mempunyai nilai validitas dan reliabilitas yang memenuhi standar. Demikian
juga instruksi yang harus diikuti oleh responden harus jelas sehingga tidak
membingungkan responden pada waktu mengisi kuesioner.
Setelah data Anda dapatkan maka data tersebut biasanya akan disimpan
pada suatu berkas (file) pada komputer. Salah satu cara memasukan data ke
dalam komputer adalah melalui entri (entry) melalui keyboard. Entri data ini
pun bisa membuka peluang untuk salah entri. Oleh karena itu nanti setelah
data selesai di entri maka sebaiknya Anda melakukan beberapa hal untuk
melihat secara sekilas apakah data Anda tidak ada yang "aneh". Hal-hal yang
dapat Anda lakukan adalah membuat tabel frekuensi, bar-chart ataupun
histogram.
Dengan tabel frekuensi Anda dapat melihat kode-kode yang mungkin
tidak Anda harapkan. Misalnya, nilai yang Anda tentukan adalah berkisar
antara 1 dan 7, tetapi karena sesuatu hal maka muncul angka 8. Dengan tabel
frekuensi tersebut, angka 8 tadi akan tampak. Dengan demikian, Anda dapat
memperbaiki data Anda tersebut. Sudah tentu tidak semua kesalahan entri
data dapat Anda lacak.
2.
Pengkodean dan Tabulasi Data
Pada kuesioner yang dijawab oleh para responden, informasi yang Anda
tanyakan biasanya berbentuk kata-kata. Jawaban ini sebaiknya Anda ubah
menjadi angka. Misalnya, terang Anda beri notasi 1, sedangkan gelap Anda
beri notasi 0. Sehingga bentuk penulisan data akan menjadi lebih sederhana.
Demikian juga kalau jawaban yang Anda dapatkan bisa diurutkan, seperti
dari selalu sampai dengan tidak pernah maka Anda dapat memberi kode
angka yang juga terurut. Contoh, respons yang disediakan adalah "selalu,
sering, kadang-kadang, jarang, dan tidak pernah". Respons ini dapat Anda
beri kode sebagai 5, 4, 3, 2 dan 1. Pengkodean seperti ini banyak mempunyai
keuntungan. Yang pertama adalah menghemat pemakaian tempat karena
membutuhkan ruang yang lebih, sedikit. Keuntungan kedua adalah lebih
sederhana. Sedangkan keuntungan yang ketiga, yaitu pemberian pengkodean
secara numerik memberikan kesempatan kepada Anda untuk melakukan
operasi jumlah, atau mendapatkan nilai rata-rata, nilai standard deviasi dan
lainnya.
Dulu, pada saat belum ada komputer yang menawarkan perangkat lunak
semacam "spreadsheet", data yang dihasilkan harus dituliskan dalam bentuk
tabel. Gunanya adalah untuk memudahkan membaca data serta memudahkan
orang membuat perhitungan-perhitungan. Tabel tersebut biasanya berbentuk
seperti matriks, yaitu ada baris dan ada kolomnya. Pada ujung baris ataupun
Metodologi Penelitian
ujung kolom orang dapat membuat jumlah total data pada masing-masing
kolom atau baris. Untuk itu, Anda harus tetapkan satu kolom untuk satu
variabel. Kalau Anda mempunyai 5 variabel maka Anda harus membuat 5
kolom.
Pada setiap kolom tersebut Anda isikan data yang Anda peroleh. Sebagai
contoh misalkan Anda mempunyai 3 variabel yang sedang diteliti. Masingmasing variabel mempunyai n buah data. Variabel I memiliki data xll, x12, x13,
..., xln. Variabel II memiliki data x21, x22, x23, ..., x2n serta variabel III
mempunyai data x31, x32, x33, ..., x3n. Adapun bentuk tabel data tersebut
adalah
:
:
:
:
:
:
:
:
:
Dengan semakin berkembangnya bentuk-bentuk perangkat lunak maka
pekerjaan tabulasi data dapat langsung Anda lakukan pada komputer.
Demikian juga dengan perhitungan-perhitungan statistiknya, dapat langsung
Anda lakukan dengan menggunakan perangkat lunak yang sesuai. Ada
banyak macam paket perangkat lunak untuk statistik, antara lain adalah
minitab, SAS, S-Plus dan SPSS. Pada modul ini, paket yang akan
diperkenalkan adalah SPSS.
L AT IH AN
Untuk memperdalam pemahaman Anda mengenai materi di atas,
kerjakanlah latihan berikut!
1) Menurut pendapat Anda mengapa data harus diperiksa kelengkapannya
terlebih dahulu sebelum Anda menganalisisnya dengan menggunakan
statistik?
2) Mengapa kita perlu memeriksa kebersihan data sebelum
menggunakannya untuk dihitung secara statistik?
3) Anda juga dianjurkan untuk membuat pengkodean pada data, apakah
gunanya menurut Anda?
Petunjuk Jawaban Latihan
Agar Anda dapat menjawab latihan di atas. Anda harus membaca kembali
mengenai kelengkapan dan kebersihan data serta coding dan tabulasi.
RA NG K UM A N
1.
2.
3.
Dalam mempersiapkan data, lakukan langkah-langkah berikut ini.
Periksa kelengkapan dan keberhasilan data.
Lakukan coding (pengkodean).
Lakukan tabulassi data.
T ES FO R M AT IF 1
Pilihlah satu jawaban yang paling tepat!
Metodologi Penelitian
1) Seandainya Anda mempunyai data yang berasal dari kuesioner, lalu data
tersebut langsung Anda masukkan ke komputer. Sebutkan apakah kirakira kerugian yang mungkin timbul bila Anda melakukan hal tersebut.
2) Menurut pendapat pribadi Anda, dengan kemajuan teknologi komputer
yang sedemikian cepat, apakah masih dibutuhkan pemindahan data dari
kuesioner ke dalam bentuk-bentuk tabel sebelum data tersebut Anda
masukkan ke komputer?
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 1 yang
terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 1.
Tingkat penguasaan =
Jumlah Jawaban yang Benar
Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali
80 - 89% = baik
70 - 79% = cukup
< 70% = kurang
Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat
meneruskan dengan Kegiatan Belajar 2. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 1, terutama bagian yang
belum dikuasai.
Kegiatan Belajar 2
K
oleksi data mentah dapat tidak mempunyai arti apa-apa kalau tidak
memberikan informasi yang berarti. Bagaimanapun baiknya data
mentah dituliskan, data mungkin tidak dapat memberikan informasi yang
berarti karena yang tampak hanyalah tumpukan angka-angka. Bagaimana
data mentah ini dapat disajikan sehingga data dapat memberikan informasi
yang berarti? Salah satu caranya adalah dengan mengorganisasikan data
tersebut sedemikian rupa sehingga dapat memberikan informasi yang berarti.
A. MEMPLOT DATA
Salah satu cara yang sederhana dalam menyajikan data yang informatif
adalah memplot data ke dalam bentuk grafik. Ada beberapa cara yang
biasanya digunakan untuk memplot data dengan grafik, antara lain adalah
distribusi frekuensi dan histogram.
1.
Distribusi Frekuensi
Langkah pertama sebelum memplot data adalah membuat distribusi
frekuensi dari data yang ada. Sebagai contoh adalah data rating tentang
keinginan pelajar mengenai usulan adanya student center. Data ini didapat
dari hasil survei terhadap tanggapan mereka mengenai usulan diadakannya
student center.
Metodologi Penelitian
!
"
!# $
#
%
&
%
# #
%
Rating (X)
0
1
2
3
4
5
6
7
8
9
10
Frekuensi(F)
0
0
0
6
19
40
49
45
30
11
0
Data dikumpulkan dengan memberikan rating 0 sampai 10 kepada
siswa, lalu mereka memilih salah satu dari rating yang diberikan. Rating 0
sampai 10 menunjukkan tingkat sangat tidak ingin sampai tingkat sangat
ingin. Data lalu dikelompokkan seperti di atas yang berisikan jumlah siswa
yang memilih rating 0 sampai 10.
'
!
"
!# ( #
*# !#
%
%
%
))
$
&
#
%
# #
%
# !# %
+
'
!
%
(
#
# #
*# !#
%
%
%
))
$
#
%
% # #
# !# %
Distribusi frekuensi dari studi ini adalah seperti yang ditunjukkan oleh
Tabel 6.1. Tabel frekuensi ini disajikan secara grafik pada Gambar 6.1. Dari
distribusi yang ditunjukkan oleh Gambar 6.1 tampak jelas bahwa ada
pendapat yang sangat lebar tentang usulan didirikannya student center. Ada 3
siswa yang mempunyai rating 3 dan 11 siswa memiliki rating 9. Tampak
bahwa ada kecenderungan data mengumpul sedikit di atas titik tengah. Nilai
rating yang paling banyak dimiliki siswa adalah nilai 6, di mana nilai ini
dipilih oleh 49 siswa.
Alternatif lain untuk menyajikan distribusi frekuensi adalah
menghubungkan titik-titik ujung atas dari garis-garis tegak yang ada pada
Gambar 6.1. Anda kemudian dapat menghapus garis- garis tegak tersebut.
Bentuk grafik seperti ini disebut sebagai frekuensi poligon. Contoh
frekuensi poligon dari data yang sama dapat dilihat pada Gambar 6.2.
2.
Histogram
Rating yang diberikan oleh peneliti tidak memungkinkan seseorang
memilih rating di luar bilangan bulat yang sudah disediakan. Artinya
seseorang tidak dapat memilih rating 3,7 karena pilihan itu tidak tersedia.
Sehingga orang yang memiliki rating antara 5,5 dan 6,5 akan terpaksa
memilih rating 6. Menyadari hal ini, kita mencoba membuat suatu grafik
yang dapat mencerminkan keadaan tersebut. Gambar tersebut adalah gambar
")
Metodologi Penelitian
kotak yang tersusun sedemikian rupa. Lebar kotak sama yang menunjukkan
lebar interval untuk masing-masing bilangan bulat, sedangkan tinggi
menunjukkan frekuensi dari bilangan bulat. Grafik seperti ini disebut
Histogram. Contoh histogram untuk data pada Tabel 6.1 adalah Gambar
6.3.
'
!
%
# # %
*# !#
%
%
, ))
$
& #
%
% # #
# !# %
B. MENGELOMPOKKAN DATA
Dalam penjelasan mengenai distribusi frekuensi dan histogram sebelum
ini, data ditampilkan dalam bentuk diskrit dengan sedikit saja perbedaan.
Akan tetapi, bagaimana kalau kita terlibat dengan data dalam bentuk satuan
waktu (menit), misalnya waktu yang digunakan oleh masing-masing dari 100
pelajar dalam memainkan permainan elektronik (electronic games) pada hari
yang ditentukan. Nilai nol akan sangat jarang terjadi, kecuali untuk pelajar
yang tidak menggunakan waktu untuk memainkan mainan tersebut.
""
1.
Data Mentah (Partial)
!
!#
# %
&
#
% #
# #
Grup Data
!
'
'
'
'
'
'
'
'
'
'
'
'
(
"
)
)
)
)
)
)
)
)
)
)
)
)
)
#$%
&
"
Metodologi Penelitian
Dengan demikian, seseorang mungkin menggunakan waktunya selama
18 menit, yang lainnya menggunakan waktu 20 menit, tetapi tak seorangpun
yang menggunakan waktu persis 19 menit. Dengan data yang bentuknya
seperti ini akan sulit sekali bagi kita untuk menyajikan distribusi frekuensi
menggunakan ide histogram. Mungkin akan sangat membantu bilamana kita
membuat grup-grup dalam interval-interval dengan interval waktu 10 menit.
Kemudian, distribusinya kita plot. Sebagai contoh adalah data pada Tabel
6.2.
Pada bagian bawah Tabel 6.2 interval tertera pada bagian paling kiri.
Batas atas dan batas bawah interval yang sebenarnya adalah bilangan yang
jatuh pada tengah-tengah antara ujung atas interval dan ujung bawah interval
berikutnya. Jadi, interval 10-19 sebenarnya mempunyai interval 9,5 - 19,5.
Selain itu tampak pula istilah titik tengah interval. Titik tengah interval
adalah nilai rata-rata dari batas atas dan batas bawah interval tersebut.
Tampak juga ada kolom yang berjudul frekuensi. Di sini tampak 8 orang
menggunakan waktu 30 - 39 menit untuk bermain mainan elektronik.
Mungkin muncul pertanyaan tentang "berapa banyak interval yang harus
dibuat bila membuat grup?”. Tidak ada jawaban yang pasti tentang
banyaknya interval yang harus dibuat. Tetapi sekitar 10 buah interval rasanya
cukup bagus untuk menyajikan data dengan cara membuat grup ini. Bentuk
distribusi frekuensi dalam grup dari Tabel 6.2 dapat Anda lihat pada Gambar
6.4.
'
!
"
2.
Distribusi Kumulatif
Semua distribusi yang didiskusikan sebelum ini menitikberatkan pada
frekuensi observasi untuk tiap skor atau untuk tiap interval, akan tetapi ada
cara lain untuk melihat data dalam bentuk distribusi, tetapi distribusi dari
frekuensi skor yang jatuh pada atau lebih kecil dari skor/interval tertentu.
Sebagai contoh, perhatikan Tabel 6.2. Tampak bahwa terdapat 20 siswa yang
memakai waktu mereka selama 0 - 9 menit, serta 10 siswa yang memakai
waktu 10 - 19 menit untuk bermain mainan elektronik. Dari sini dikatakan
bahwa jumlah siswa yang menggunakan waktu bermain 19 menit atau kurang
adalah 20 + 10 siswa = 30 siswa. Distribusi yang menggambarkan frekuensi
kumulatif disebut distribusi kumulatif
Contoh frekuensi kumulatif adalah pada Tabel 6.2 bagian paling kanan.
Sedangkan plot datanya ada pada Gambar 6.5.
'
!
!#
!
# #
$%
%
&
#
%
# #
L AT IH AN
Untuk memperdalam pemahaman Anda mengenai materi di atas,
kerjakanlah latihan berikut!
Anak-anak berbeda dengan orang dewasa dalam hal menceritakan
kembali apa yang sudah diberikan. Anak-anak cenderung menceritakan
sesuatu dengan mengingat-ingat cerita berdasarkan urutan. Sedangkan orang
tua lebih ke cerita secara menyeluruh. Oleh karena itu, pada anak-anak bila
menceritakan kisah dari film, kata-kata seperti "dan kemudian ..." sering
"
Metodologi Penelitian
sekali terdengar. Suatu eksperimen lalu dibuat, di mana 50 orang anak-anak
disuguhi tontonan film. Setelah itu mereka diminta untuk menceritakan
kembali kisah dari film tersebut. Si peneliti dalam salah satu variabel
penelitiannya menghitung kata-kata "dan kemudian ..." . Hasil catatannya
adalah sebagai berikut.
18
17
20
11
19
15
21
23
19
16
22
23
22
31
19
18
10
16
18
20
17
17
17
21
19
15
18
20
19
19
20
20
21
20
17
15
20
18
12
18
18
18
16
17
18
40
16
19
24
18
1) Plot distribusi frekuensi (bukan yang digrupkan) dari data di atas.
2) Buatlah histogramnya.
3) Buatlah distribusi frekuensi kumulatifnya.
Petunjuk Jawaban Latihan
Lihat contoh-contoh yang diberikan
RA NG K UM A N
Untuk mengajukan data agar informasinya dapat dengan mudah
dimengerti maka plotlah data tersebut, atau buatlah histogramnya. Sajian
data dalam bentuk seperti ini akan lebih mudah di mengerti oleh
pembaca.
T ES FO R M AT IF 2
Pilihlah satu jawaban yang paling tepat!
Untuk penelitian yang sama, peneliti meminta 50 orang dewasa untuk
menonton film yang disuguhkan dan meminta mereka menceritakan kembali
"
kisah film tersebut. Peneliti juga mencatat berapa banyak kata-kata "dan
kemudian ..." disebut oleh mereka. Datanya adalah:
10
9
10
3
15
12
9
14
11
9
5
11
7
14
8
15
16
8
13
12
9
12
10
17
1
5
12
14
4
10
8
10
11
9
7
9
12
7
11
8
7
11
11
15
9
14
10
16
10
10
1) Dengan hanya melihat ke dua macam data di atas dapatkah Anda melihat
perbedaan antara anak-anak dan orang dewasa dalam menceritakan
kembali cerita film yang mereka tonton?
2) Plotlah distribusi frekuensinya (bukan yang digrupkan).
3) Buatlah histogramnya!
4) Buatlah frekuensi kumulatifnya!
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 2 yang
terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 2.
Tingkat penguasaan =
Jumlah Jawaban yang Benar
Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali
80 - 89% = baik
70 - 79% = cukup
< 70% = kurang
Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat
meneruskan dengan Kegiatan Belajar 3. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 2, terutama bagian yang
belum dikuasai.
"
Metodologi Penelitian
Kegiatan Belajar 3
*
$ %
*
. $
P
rosedur statistik secara kasar dapat dibagi menjadi dua bagian, yaitu
statistik deskriptif dan statistik inferensi. Perbedaan kedua prosedur
ini akan dibahas secara ringkas berikut ini.
1.
Statistik Deskriptif
Bila maksud penelitian yang Anda buat adalah hanya untuk
menerangkan keadaan suatu set data, maka Anda hanya terlibat dengan
statistik deskriptif. Sebagai contoh adalah nilai rata-rata untuk pelajaran
Matematika di suatu kelas atau jumlah korban pembunuhan setiap bulannya
di DKI.
Pada statistik deskriptif teknik-teknik yang paling sering adalah memplot
data, mencari nilai rata-rata beserta nilai standar deviasinya, menghitung nilai
percentile, mencari nilai median, modus dan sebagainya. Teknik-teknik dasar
ini juga akan dipakai pada statistik inferensi. Oleh karena itu, setiap orang
yang mempelajari statistik harus tahu tentang teknik-teknik dasar tersebut.
2.
Statistik Inferensi
Keputusan yang diambil dari data yang sangat terbatas untuk menaksir
keadaan di populasi biasanya merupakan kesimpulan yang tidak tepat. Hal ini
karena data yang diambil biasanya tidak representatif atau tidak mewakili
keadaan di populasi. Sebagai contoh, Anda mendengar bahwa orang yang
jangkung cenderung lebih sopan dari orang yang lebih pendek. Anda lalu
setuju dengan pendapat itu karena salah seorang teman Anda yang jangkung
memang sangat sopan. Dalam kasus ini Anda hanya melihat contoh untuk
satu orang saja, bagaimana dengan orang-orang lainnya. Oleh karena itu,
sebelum menyetujui pendapat di atas Anda harus menelitinya dengan lebih
banyak orang yang mempunyai tinggi yang berbeda-beda. Pendapat dari
seseorang bahwa anak wanita lebih cepat dapat berbicara daripada anak lakilaki karena orang tersebut mempunyai anak wanita yang lebih cepat berbicara
dibandingkan dengan anak laki-lakinya, belum tentu benar. Observasi
tunggal yang hasilnya digeneralisasi mungkin dapat dibenarkan bilamana
"
observasi dilakukan pada "sesuatu" yang memiliki variabilitas yang sangat
kecil. Untuk mengetahui berapa jumlah kaki sapi, kita hanya perlu
mengambil seekor sapi dan menghitung jumlah kakinya. Kita tidak
membutuhkan jumlah sapi yang besar untuk sekadar mengetahui jumlah
kakinya. Hal ini dapat dibenarkan karena variasi jumlah kaki sapi sangat
kecil. Memang ada sapi yang cacat yang memiliki kaki yang tidak sama
dengan empat, tetapi jumlahnya tidaklah banyak sehingga variabilitas jumlah
kaki sapi akan sangat kecil.
Kebanyakan bidang psikologi dan ilmu sosial lainnya menggunakan
statistika inferensi. Untuk mengulas sedikit tentang konsep statistik akan
dibahas sedikit konsep mengenai populasi, sampel, parameter dan statistik.
Selain itu juga akan dibahas pula statistika parametrik dan statistika
nonparametrik.
3.
Populasi, Sampel, Parameter, dan Statistika
Populasi dapat didefinisikan sebagai seluruh koleksi kejadian yang Anda
teliti (seperti nilai IPK seluruh mahasiswa FMIPA UT, nilai NEM siswa SD
seluruh Indonesia). Jadi, kalau kita tertarik untuk meneliti NEM siswa SD
sepuluh tahun terakhir di Indonesia maka seluruh siswa SD yang mengikuti
Ebtanas sepuluh tahun terakhir ini adalah merupakan populasi penelitian kita.
Besar atau kecilnya populasi tergantung dari niat penelitian. Kalau kita ingin
menyelidiki tinggi badan rata-rata rakyat Indonesia maka populasinya adalah
seluruh rakyat Indonesia. Tetapi kalau yang diinginkan adalah tinggi rata-rata
rakyat Indonesia yang berusia 17 - 24 tahun maka populasinya adalah rakyat
Indonesia yang berusia 17- 24 tahun. Tampak bahwa kedua populasi di atas
besarnya berbeda walaupun sama-sama mengukur tinggi badan. Populasi
dapat bergerak dalam range sangat kecil sampai tak terbatas. Dari sisi teori,
populasi juga bisa terbilang dan tak terbilang.
Dalam penelitian, meneliti populasi hampir tidak mungkin. Banyak
sebabnya, antara lain waktu dan biaya. Oleh karena itu, peneliti mencoba
menaksir keadaan populasi dengan meneliti sebagian saja dari populasi
tersebut. Bagian populasi yang diteliti inilah yang dikenal dengan istilah
sampel. Untuk lebih jelasnya, sampel didefinisikan sebagai observasi aktual
yang merupakan subset dari populasi.
Bilamana kita mengambil sampel, biasanya kita menghitung nilai-nilai
numerik (seperti mean dan standard deviasi) yang menerangkan tentang
"
Metodologi Penelitian
keadaan data yang kita miliki. Bila nilai-nilai ini dihitung berdasarkan sampel
yang kita ambil maka nilai-nilai ini disebut dengan istilah statistik. Nilainilai statistik yang kita hitung mempunyai kaitan dengan nilai pada populasi.
Nilai populasi yang berkaitan dengan nilai statistik disebut dengan
parameter. Jadi, populasi juga mempunyai nilai rata-rata, tetapi nilainya
tidak diketahui. Sedangkan sampel mempunyai nilai rata-rata yang bisa
dihitung. Nilai rata-rata pada populasi adalah salah satu contoh dari
parameter.
4.
Memilih Prosedur Statistik
Di atas sudah dijelaskan perbedaan antara statistik deskriptif dan statistik
inferensi. Tapi pertama-tama yang harus dikuasai adalah statistik deskriptif
karena berguna untuk mendeskripsikan data dan juga berguna untuk
menginferensi keadaan data di populasi. Bila menggunakan statistik inferensi
maka diperlukan alat bantu untuk memilih prosedur statistik yang akan
digunakan. Alat bantu pemilihan prosedur statistik ini kita sebut saja dengan
pohon keputusan (decision tree), yang bentuknya adalah sebagai berikut:
'
!
"+
Dengan pohon keputusan ini Anda dapat lebih mudah melihat (secara
kasar) prosedur statistik yang mana yang cocok dengan kebutuhan Anda.
Sudah tentu diagram tree di atas tidak menunjukkan semua prosedur statistik
yang tersedia. Karena di samping statistik univariat terdapat pula statistik
multivariat.
5. Jenis-jenis Data
Data numerik biasanya berasal dari dua jenis, yaitu data pengukuran
(measurement) data dan data katagorikal (catagorical data). Data
pengukuran atau yang juga dikenal dengan data kuantitatif adalah data yang
dihasilkan dari mengukur variabel yang diteliti. Sebagai contoh adalah IPK
mahasiswa UT, tinggi atau berat murid SD kelas 6, kecepatan membaca
seseorang. Data jenis ini diukur dengan suatu alat ukur.
Sedangkan data katagorikal, juga dikenal sebagai data frekuensi adalah
terdiri dari pernyataan-pernyataan seperti "seratus tiga puluh orang menyukai
cokelat batangan yang berisi kacang" sedangkan "dua puluh tiga orang
menyukai cokelat batangan tanpa isi". Pada data jenis ini kita menghitung
sesuatu dan data tersebut terdiri dari jumlah total atau frekuensi dari masingmasing katagori (karena itu disebut data katagorikal). Beberapa ratus anggota
fakultas mungkin memilih kurikulum baru dalam suatu voting, tetapi data
yang dihasilkan nantinya akan terdiri dari dua macam bilangan saja, yaitu
yang setuju dan yang tidak setuju dengan kurikulum baru. Berbeda dengan
data katagorikal, pada data pengukuran bilamana terdapat 120 objek yang
diukur maka akan dihasilkan sejumlah persis 120 data.
Kadangkala kita dapat mengukur variabel yang sama dengan dua macam
data. Misalnya, variabel tinggi dapat diukur dengan sentimeter sehingga
kalau terdapat 100 orang yang akan diukur tingginya maka akan terdapat 100
data tentang tinggi badan orang-orang yang diukur. Tetapi kita juga dapat
menggunakan klasifikasi tinggi, sedang dan pendek untuk mengukur tinggi
orang. Yang terakhir ini adalah katagorikal. Kedua jenis data ini akan
diperlakukan secara berbeda nantinya.
6.
Perbedaan (differences) dan Keterhubungan (relationship)
Pada umumnya pernyataan statistik, akan jatuh ke dalam salah satu
katagori perbedaan atau keterhubungan. Sebagai contoh, seorang peneliti
tertarik untuk meneliti apakah ada perbedaan kinerja terhadap tugas tertentu
yang dilakukan oleh perokok dan oleh bukan perokok. Tetapi peneliti yang
)
Metodologi Penelitian
lainnya tertarik untuk mengetahui apakah ada hubungan antara jumlah rokok
yang dihisap dengan skor kinerja terhadap tugas tertentu tadi. Walaupun
kedua pertanyaan itu tampaknya saling tumpang tindih, tetapi mereka berdua
akan diperlakukan secara berbeda.
7.
Banyak Grup atau Variabel
Banyak grup atau variabel juga menentukan teknik statistik yang mana
yang akan dipakai. Seperti yang dapat dilihat pada decision tree, jumlah grup
(variabel) yang berbeda akan menggunakan teknik statistik yang berbeda. Uji
mean dengan hanya 2 grup akan lain tekniknya dengan uji mean untuk lebih
dari 2 grup. Demikian juga jumlah variabel yang berbeda dapat memakai
teknik statistik yang berbeda pula. Kalau uji mean untuk tiga grup tapi
dengan satu variabel bebas akan memakai oneway ANOVA, tetapi uji mean
untuk tiga grup dengan dua variabel bebas akan menggunakan factorial
ANOVA. Untuk tingkat yang lebih rumit Anda dapat juga membuat
penelitian dengan lebih dari satu variabel tak bebas (Anda dapat
mempelajarinya pada statistika multivariat).
8.
Skala Pengukuran
Topik skala pengukuran ini walaupun tampaknya sederhana, tetapi
cukup memainkan peranannya dalam penelitian. Banyak orang yang masih
melakukan kesalahan mendasar karena salah mengerti dalam memahami
skala pengukuran ini. Contohnya, masih ada peneliti yang membuat korelasi
antara variabel nominal. Katakanlah seorang peneliti mempunyai data IPK
dari 10 SMU (sebut sebagai SMU I sampai dengan SMU X). Pemberian
angka I sampai X ini adalah penamaan secara nominal. Kalau teknik statistik
yang digunakan adalah teknik korelasi maka apa artinya ini?
Pengukuran (measurement) biasanya didefinisikan sebagai pemberian
bilangan-bilangan ke objek-objek. Kata bilangan dan objek di sini biasanya
sering tercampur. Misalnya kita akan mengukur pengetahuan pelajar tentang
IPA. Kita mengukur pengetahuan pelajar (melalui tes) dengan memberikan
bilangan (hasil tes) kepada pelajar (objek) yang diuji.
"
9.
Skala Nominal
Skala Nominal adalah bilangan yang digunakan hanya untuk
membedakan objek-objek yang diteliti. Pada dasarnya skala ini bukanlah
merupakan skala karena ia tidak mengukur sesuatu, tetapi hanya memberi
label saja. Contoh skala nominal adalah nomor punggung pemain bola,
nomor telepon dan jenis kelamin pria = 1, wanita = 2. Biasanya penomoran
ini tidak mempunyai arti lain kecuali untuk membedakan satu dengan yang
lainnya. Skala nominal juga dapat menggunakan huruf. Skala nominal
biasanya digunakan untuk klasifikasi. Data katagori yang sudah dijelaskan
sebelum ini memakai skala nominal, sebab dalam observasi mereka biasanya
menunjukkan sesuatu seperti pria/wanita, setuju/tidak setuju.
10. Skala Ordinal
Skala Ordinal adalah bilangan yang digunakan untuk menempatkan
objek-objek di dalam suatu urutan. Skala ordinal akan mengurutkan objek
penelitian pada suatu kontinum. Salah satu contohnya adalah besar, sedang,
kecil dapat Anda beri skala 3, 2, dan 1. Di sini urutan objek dapat dibuat.
Yaitu 3 > 2 > 1. Sedangkan pada skala nominal kita tidak dapat membuat
urutan seperti ini sebab pemberian angkanya hanya untuk membedakan objek
penelitian semata-mata. Contoh lainnya adalah ranking di suatu kelas yang
dihitung berdasarkan IPK misalnya. Di sini rangking tersebut dapat di
urutkan. Apakah kita bisa mengatakan bahwa perbedaan IPK antara ranking I
dan ranking II sama dengan perbedaan IPK antara ranking IX dan ranking
X?. Kita tidak bisa mengatakan bahwa perbedaan mereka adalah sama
besarnya. Jadi pada skala ordinal yang dapat dikatakan hanya perbedaan
urutannya saja. Kita tidak mempunyai informasi tentang perbedaan di antara
mereka.
11. Skala Interval
Skala Interval adalah skala di mana interval-interval yang sama
besarnya di antara objek-objek, menunjukkan perbedaan yang sama pula,
sehingga perbedaan mempunyai arti. Dengan skala interval kita tidak hanya
bisa mengurutkan objek-objek, tetapi juga dapat melihat perbedaan di antara
mereka. Contoh skala ini adalah temperatur yang diukur dalam derajat
Fahrenheit. Perbedaan antara temperatur 10°F dan 20°F dengan 80°F dan
90°F adalah sama. Akan tetapi, pada skala interval ini yang tidak bisa
Metodologi Penelitian
dilakukan adalah membuat ratio. Sehingga kita tidak bisa mengatakan bahwa
panas dengan temperatur 40°F adalah setengah dari panas dengan temperatur
80°F, atau dua kali panas dengan temperatur 20°F. Hal ini karena titik 0 pada
skala itu letaknya tidak tetap. Contohnya 20°F and 40°F ekivalen dengan 7°C dan 4°C. Jadi, 0°F dan 0°C tidak terletak pada titik yang sama. Sehingga
pada temperatur, titik 0 nya tergantung pada skala mana yang digunakan.
Oleh karena itu, titik 0 pada skala temperatur bukanlah titik 0 yang
sebenarnya.
12. Skala Ratio
Skala ratio adalah skala yang memiliki titik 0 yang sebenarnya. Oleh
karena itu, pada skala ini kata ratio benar-benar memiliki arti. Titik ini
letaknya tetap, dan tidak pernah berubah seperti titik 0 pada skala
temmperatur. Titik 0 adalah titik yang berkaitan dengan tidak adanya
(absence) sesuatu yang diukur. Karena 0°F dan 0°C bukanlah merupakan
ketidak beradaan sesuatu yang diukur maka mereka bukanlah titik 0 yang
sebenarnya. Dengan skala rasio ini sifat-sifat yang ada pada skala
sebelumnya tercakup di dalamnya. Juga, dengan skala ini kita dapat
mengatakan bahwa 10 detik adalah 2 kalinya 5 detik dan 7 kg adalah
seperduanya 14 kg.
Tampak bahwa skala rasio ini tidak sulit diterima bila diukur untuk
pemakaian pada fisika, tetapi bagaimana kalau dilakukan pengukuran pada
daerah sosial? Misalkan di suatu kelas diadakan ujian untuk mata pelajaran
tententu. Nilai minimum adalah 0 dan nilai maksimum adalah 100.
Seseorang yang tidak belajar atau cukup bodoh katakanlah menerima nilai 0.
Apakah dapat kita katakan ia tidak berpengetahuan? Orang yang lain lagi
mendapat nilai 40 dan 80. Dapatkah kita katakan bahwa yang bernilai 80
pengetahuannya adalah 2 kali yang bernilai 40? Jawabannya tidak.
13. Variabel-variabel
Dalam penelitian istilah variabel akan sering sekali Anda gunakan. Oleh
karena itu, istilah ini perlu Anda pahami. Variabel adalah sifat-sifat dari
objek-objek atau kejadian-kejadian yang dapat mengambil nilai-nilai yang
berbeda (Howell, 1989). Warna rambut adalah contoh variabel karena ia
merupakan sifat dari objek (rambut), dan ia dapat mengambil beberapa warna
seperti cokelat, pirang, putih, merah ataupun hitam. Sesuatu seperti panjang,
lebar, isi adalah juga variabel (karena alasan yang sama).
Variabel dapat dibedakan berdasarkan banyaknya nilai yang dimiliki
menjadi dua macam, yaitu variabel diskrit dan variabel kontinu. Variabel
diskrit hanya mempunyai sejumlah kecil nilai yang mungkin. Contohnya
adalah jenis kelamin, status perkawinan, jumlah TV yang dimiliki oleh suatu
keluarga. Sedangkan variabel kontinu dapat mempunyai tak terbilang
banyaknya nilai yang mungkin. Contohnya adalah, ukuran panjang, volume,
tinggi manusia. Tinggi manusia, misalnya bergerak dari 0 m sampai 3 m. Di
antara bilangan 0 dan 3 m ini terdapat tak terbilang banyaknya bilangan yang
mungkin.
Di dalam statistik variabel juga dapat dibagi menjadi 2 macam, yaitu
variabel bebas dan variabel tak bebas. Menurut Howell (1989), variabel
bebas adalah variabel yang dapat dimanipulasi oleh peneliti atau dapat
dikontrol. Sedangkan variabel tak bebas adalah variabel yang tidak dapat
dikontrol oleh peneliti. Sebagai contoh misalnya pada eksperimen di bidang
pertanian. Seorang peneliti ingin melihat pengaruh temperatur dan pupuk
terhadap pertumbuhan suatu tanaman (diukur dari tinggi dan lingkar batang).
Peneliti di sini dapat mengatur jenis-jenis pupuk yang akan dipakai. Ia juga
dapat mengatur ukuran temperatur pada eksperimen yang akan dilakukan.
Variabel temperatur dan pupuk di sini adalah variabel bebas. Sedangkan
pertumbuhan tanaman yang diukur dengan tinggi dan diameter batang adalah
variabel tak bebas (nilai variabel ini bergantung dari nilai variabel bebas
sehingga ia dikatakan variabel tak bebas).
14. Ukuran keterpusatan
Ukuran keterpusatan adalah bilangan yang menunjukkan pusat dari
distribusi data. Sebelum ini sudah kita diskusikan cara menyajikan data
sehingga kita bisa dengan mudah melihat keadaan data tersebut. Plotting data
memudahkan kita melihat bentuk distribusi data. Sedangkan pada ukuran
keterpusatan akan memberikan informasi tentang pusat dari data. Ada tiga
macam bentuk ukuran keterpusatan yaitu mode, median dan mean.
Mode dapat didefinisikan sebagai nilai (skor) yang paling banyak
muncul. Sebagai contoh, lihat Tabel 6.1. Pada Tabel ini modenya adalah 6,
karena nilai 6 muncul sebanyak 49 kali. Sedangkan nilai lainnya muncul
tetapi lebih kecil dari 49 kali. Bagaimana kalau nilai terbesar yang muncul
Metodologi Penelitian
ada lebih dari satu? Untuk itu kita katakan bahwa modenya ada lebih dari
satu buah.
Median didefinisikan sebagai nilai (skor) yang berkaitan dengan suatu
titik di mana (bila data diurutkan) 50% dari data akan berada di bawah skor
median ini. Kalau data 5, 8, 3, 7, 15 diurutkan akan didapat 3, 5, 7, 8, 15 yang
memiliki nilai median = 7. Tampak bahwa separuh data berada di bawah nilai
7. Kalau banyak data katakanlah ada N buah, bagaimana cara menentukan
letak mediannya? Cara menentukan lokasi median (setelah data diurutkan)
adalah
N + 1
Lokasi Median =
2
Seperti contoh di atas lokasi mediannya adalah data ke (5 +1)/2 = 3.
Tampak bahwa data yang ke-3 adalah 7. Bagaimana kalau banyak data genap
(misalnya 12)? Kalau banyak data 12 maka mediannya terletak pada data ke
6,5. Artinya nilai mediannya adalah data ke 6 ditambah data ke tujuh lalu
dibagi 2. Untuk data pada Tabel 6.1 maka mediannya adalah data ke (200 +
1)/2 = 100, 5. Ini artinya data ke 100 + data ke 101 lalu dibagi 2 di mana
hasilnya adalah 6.
Mean adalah nilai ukuran keterpusatan yang paling sering digunakan
orang. Nilai mean adalah jumlah skor total dibagi dengan banyaknya data.
Nilai ini biasanya diberi Notasi X ,
N
∑
dengan X =
i = 1
X
i
N
15. Ukuran Variabiliti
Di atas sudah dibahas konsep tentang pusat distribusi. Akan tetapi,
informasi tersebut masih belum lengkap untuk menjelaskan keadaan suatu
distribusi. Untuk melengkapi informasi tentang keadaan suatu distribusi
haruslah ada ukuran lain yang digunakan yaitu tentang bagaimana "sebaran"
nilai-nilai observasi yang dimiliki terhadap pusat distribusi. Ukuran yang
mengacu terhadap sebaran nilai-nilai observasi dengan nilai dari pusat
distribusi disebut dengan istilah dispersi atau variabiliti. Ada beberapa
macam ukuran dispersi, tetapi yang dibahas di sini adalah variansi dan
standar deviasi.
Secara matematik variansi adalah jumlah kuadrat dari perbedaan antara
nilai-nilai observasi dengan nilai mean dibagi (N-1). Kalau perbedaan
tersebut tidak dikuadratkan, maka jumlah total dari perbedaan-perbedaan
adalah nol. Pembagian dengan (N-1) adalah agar nilai variansi yang didapat
adalah merupakan taksiran yang unbiased untuk nilai parameter di populasi.
Mengenai sifat-sifat taksiran dapat Anda pelajari pada mata kuliah statistik
lainnya. Formula matematik untuk variansi adalah:
N
∑
S
2
=
i = 1
( xi − x )
2
N − 1
Sedangkan standar deviasi secara matematik adalah akar dari variansi.
Simbol untuk standar deviasi adalah s atau sd, yang formulanya adalah:
N
∑(
sd =
i = 1
x1 − x )
N
2
− 1
L AT IH AN
Untuk memperdalam pemahaman Anda mengenai materi di atas,
kerjakanlah latihan berikut!
1) Kalau seandainya Anda mempunyai data yang berasal dari skala
nominal, apakah ada artinya kalau seandainya data tersebut Anda
urutkan?
2) Sebutkanlah definisi mean, median, dan mode!
3) 5 ekor tikus disuruh berlari. Peneliti mencatat jumlah tikus yang mampu
menjalani sejumlah putaran tertentu. Data yang diperoleh adalah:
Jumlah putaran lari
Jumlah tikus
18
1
19
0
20
4
21
3
22
3
23
3
24
1
Metodologi Penelitian
Hitunglah nilai mean, median dan mode dari jumlah putaran lari yang
diperoleh tikus-tikus di atas.
4) Diberikan data: 8 7 12 14 3 dan 7.
a) Hitung mean, median dan modenya.
b) Kurangi masing-masing data dengan 5, lalu hitung mean, median
dan modenya
Perhatikan perbedaan nilai mereka dengan nilai dari data asli.
c) Kalikan masing-masing data dengan 2, lalu hitung mean, median
dan modenya.
Perhatikan perbedaan nilai mereka dengan nilai dari data yang asli.
5) Hitunglah nilai variansi dan standar deviasi dari soal no. 4 a), b), dan c)
di atas.
Petunjuk Jawaban Latihan
Perhatikan contoh-contoh yang diberikan.
RA NG K UM A N
1.
2.
Statistik deskriptif digunakan bila peneliti ingin menerangkan
keadaan suatu data seperti nilai rata-rata atau sebarannya.
Statistik inferensi digunakan untuk menerangkan keadaan suatu data
"besar" dari data “kecil” yang diambil dari data “besar” tadi. Di sini
akan terkait sampel, populasi, uji kode, uji keterhubungan (korelasi).
T ES FO R M AT IF 3
Pilihlah satu jawaban yang paling tepat!
Diberikan data: 5
8 9 4 6 3
Hitunglah
a) nilai mean, median dan modenya;
b) nilai variansi dan standar deviasinya.
7
8
7
3
Cocokkanlah jawaban Anda dengan Kunci Jawaban Tes Formatif 3 yang
terdapat di bagian akhir modul ini. Hitunglah jawaban yang benar.
Kemudian, gunakan rumus berikut untuk mengetahui tingkat penguasaan
Anda terhadap materi Kegiatan Belajar 3.
Tingkat penguasaan =
Jumlah Jawaban yang Benar
Jumlah Soal
× 100%
Arti tingkat penguasaan: 90 - 100% = baik sekali
80 - 89% = baik
70 - 79% = cukup
< 70% = kurang
Apabila mencapai tingkat penguasaan 80% atau lebih, Anda dapat
meneruskan dengan modul selanjutnya. Bagus! Jika masih di bawah 80%,
Anda harus mengulangi materi Kegiatan Belajar 3, terutama bagian yang
belum dikuasai.
Metodologi Penelitian
/# 0 1 & !
(
$
Tes Formatif 1
1) Seandainya banyak terdapat informasi yang dapat diberi kode dan Anda
tidak melakukan pengkodean maka akan banyak sekali waktu yang Anda
butuhkan untuk memasukkan data ke komputer. Lagi pula ruang yang
dibutuhkan akan besar sekali bila dibandingkan dengan informasi yang
sudah diberi kode. Di samping itu, kalau Anda tidak melakukan
pengkodean maka Anda akan menemui kesulitan sewaktu akan
melakukan analisis data.
2) Kita tidak harus memindahkan data dari kuesioner ke suatu tabel terlebih
dahulu. Kalau kita sudah memberi kode untuk informasi di kuesioner,
dan setelah kita periksa kuesioner tersebut maka kita dapat langsung
menuliskan informasi dari kuesioner langsung ke komputer. Kalau sudah
selesai memasukkan data tersebut maka kita dapat membuat tabel-tabel
yang kita inginkan dengan mudah.
Walaupun tidak ada larangan untuk memindahkan data dari kuesioner ke
kertas dalam bentuk tabel, tetapi hal ini akan menyita waktu yang tidak
sedikit. Dengan sudah sedemikian majunya perangkat lunak yang ada
maka kita tidak perlu melakukan pemindahan ke kertas dulu.
Tes Formatif 2
1) Tampak selintas bahwa anak-anak lebih banyak memakai kata-kata "dan
kemudian ..:". Kelihatan angka-angka yang ada pada orang dewasa
banyak yang lebih kecil dari angka-angka yang muncul pada anak-anak.
2)
+
3)
4)
Tes Formatif 3
a) mean = 6 ; median = 6,5 ; mode = 3, 7, dan 8 di mana masing-masing
mempunyai frekuensi yang sama besar yaitu 2.
b) Variansi = 4,67 dan standar deviasi = 2,16
)
Metodologi Penelitian
$
#
Howel. D.C. (1989). Fundamental Statistics for the Behavioral Sciences.
Boston: PWS-KENT Publishing Company.
Norusia. M.J. (1990). SPSS: SPSS/PC+ 4.0. Base Manual. USA: SPSS Inc.