Pertemuan 1-2
Pertemuan 1-2
Pertemuan 1-2
Kita sangat akrab dengan kata “statistik” dalam kehidupan sehari-hari, bahkan di
negara kita terdapat lembaga negara yang bernama Badan Pusat Statistik (BPS). Kita juga
sering mendengar istilah “observasi”, “data”, “sensus”, “sample”, “populasi” dan lain-lain.
Mirip dengan kata statistik, terdapat kata “statistika” seperti terlihat pada judul bab ini di
atas. Berikut definisi beberapa istilah tersebut:
DATA adalah hasil observasi atau pengamatan yang telah dikumpulan. Data dapat berupa hasil
pengukuran; misalnya data tinggi dan berat badan, hasil pengelompokan; misalnya jenis
kelamin, hasil jawaban responden terhadap suatu quesioner; misalnya tingkat kepuasan.
POPULASI adalah koleksi lengkap semua elemen yang akan diselidiki. Suatu koleksi
dikatakan lengkap jika ia memuat semua subjek yang akan diselidiki.
STATISTIKA DESKRIPTIF adalah statistika yang berkaitan dengan analisis dan deskripsi
suatu grup sebagai populasinya, tanpa melakukan penarikan kesimpulan apapun untuk
komunitas yang lebih luas dari grup tersebut.
STATISTIKA INFERENSI adalah statistika yang mencoba untuk membuat suatu deduksi
atau kesimpulan pada populasi dengan menggunakan sampel dari populasi tersebut.
Sebagai contoh, suatu lembaga survey melakukan wawancara terhadap 2350 penduduk
Indonesia untuk mengetahui tingkat kepuasan terhadap kinerja pemerintah. Dalam hal ini
sebanyak 2350 penduduk merupakan sampel dan keseluruhan penduduk Indonesia sekitar 230
juta jiwa adalah populasinya. Kalau tidak salah, setiap 5 tahun sekali pemerintah melakukan
sensus ekonomi atau sensus pertanian. Pada kegiatan sensus semua kepala keluarga didata dan
data yang terkumpul disebut sensus atau data sensus.
Pengumpulan data dengan cara sensus membutuhkan biaya, waktu dan tenaga yang
banyak. Untuk alasan efisiensi, dalam banyak kasus pola atau kelakukan populasi cukup
dipelajari melalui sampelnya. Nantinya, hasil analisis pada sampel ini digunakan untuk
memberikan kesimpulan pada populasi asalnya. Agar dapat diharapkan kesimpulan yang valid
maka sampel yang diambil haruslah representatif, artinya ia benar-benar mewakili populasinya.
Sampel yang tidak valid akan melahirkan kesimpulan yang menyimpang dari keadaan yang
sesungguhnya.
Pemilu atau pilkada di Indonesia dilakukan untuk mengatahui aspirasi dari semua
pemilih. Jadi pemilu merupakan proses sensus untuk populasi pemilih; walaupun
kenyataannya tidak semua data populasi dapat diperoleh karena banyaknya “golput”.
Sedangkan, lembaga survey yang melakukan perhitung cepat atau “quick count” adalah
melakukan proses sampling, artinya data hanya diambil dari sebagian TPS yang tersebar
dengan cara sedemikian rupa sehingga data yang diperoleh “dipercaya” dapat mewakili para
pemilih semuanya. Hasilnya sangat cepat diperoleh dikarenakan data yang diambil hanya
sebagian kecil dari data sesungguhnya. Keakuratan kesimpulan yang diambil bergantung
pada kualitas sampel yang ambil dan metoda analisis data yang digunakan.
Ingat, dalam sistem sampling terdapat faktor kesalahan yang sudah diperhitungkan sejak
awal. Diantara faktor kesalahan ini adalah sampling error yang merupakan ukuran peluang
ketidakmiripan sampel dengan populasinya. Juga, metoda yang digunakan dalam melakukan
analisis data selalu didasarkan pada teori probabilitas. Artinya tidak ada kesimpulan
apapun dalam statistik yang bersifat eksak; semuanya mempunyai peluang kejadian sebaliknya.
Sangat dimungkinkan beberapa lembaga survey perhitungan cepat pilkada memberikan
kesimpulan yang berbeda satu sama lainnya; terutama bila kedaan sesungguhnya hanya
memberikan selisih yang sangat tipis. Masih ingat dengan kasus pilkada Jawa Timur beberapa
waktu yang lalu.
1.2 Tipe-tipe data
Pada bagian sebelumnya kita telah mendefinisikan sampel dan populasi. Keduanya
dibedakan berdasarkan proses melakukan observasi. Untuk membedakan antara data sampel dan
data populasi biasanya digunakan istilah statistik dan parameter.
CONTOH
1. Berdasarkan sensus ekonomi tahun 2010 terdapat 35% rumah tangga di Indonesia
tergolong miskin. Nah, angka 35% ini adalah parameter karena ia diperoleh dari populasi
yaitu semua rumah tangga di Indonesia.
2. Berdasarkan hasil survey terhadap 50 orang mahasiswa pendidikan matematika
UNMUH Ponorogo angkatan 2008/2009 diperolah bahwa rata-rata NEM matematika
mereka adalah 6.75. Angka 6.75 ini adalah statistik karena ia diberikan oleh sampel yang
terdiri dari 50 orang mahasiswa tersebut.
Selain data yang berbentuk angka seperti cpntoh di atas, terdapat pula data dalam bentuk
kategori. Kedua bentuk data ini didefinisikan secara formal sebagai berikut :
DATA KUANTITATIF adalah data yang menggambarkan hasil perhitungan atau hasil
pengukuran.
DATA KUALITATIF atau DATA KATEGORI adalah data yang dapat dipisahkan dalam
beberapa kategori atau kelompok yang dibedakan oleh karakter bukan numerik.
CONTOH
1. Data kuantitatif: tinggi badan, nilai NEM, temperatur dalam derajat celsius, besar
penghasilan.
2. Data kualitatif: jenis kelamin, profesi, temperatur dalam rasa (dingin, panas sejuk).
Selanjutnya, data kuantitatif dibedakan atas data diskrit dan data kontinu.
DATA DISKRIT adalah data yang banyak kemungkinannya berhingga atau terbilang. DATA
CONTOH
1. Data diskrit: jam kerja dalam sehari (kemungkinannya adalah 1, 2, 3, … , 24), banyak
telor yang dihasilkan oleh ayam betina, banyak hari libur dalam setiap bulan.
2. Data kontinu: temperatur udara di berbagai tempat (kemungkinannya: semua nilai
yang ada pada interval, misalnya dari -20 derajat celsius sampai dengan 50 derajat
celsius.
Cara umum yang digunakan untuk mengklasifikasikan data adalah ditentukan oleh empat
macam level pengukuruan, yaitu level nominal, ordinal, interval dan rasio. Dalam statistika
terapan, level pengukuran data merupakan faktor penting dalam menentukan prosedur dan
metoda statistika yang digunakan.
LEVEL NOMINAL dicirikan oleh data yang terdiri atas nama-nama, label, atau
kategori. Data seperti ini tidak dapat diurutkan seperti dari atas ke bawah, atau sebaliknya.
LEVEL ORDINAL data yang diperoleh pada level ini dapat disusun dalam urutan tertentu,
tetapi selisih nilai-nilainya tidak dapat ditentukan atau bahkan tidak bermakna sama sekali.
CONTOH: Berikut adalah contoh data yang diperoleh dari pengukuran level ordinal
1. Nilai akhir pada KHS mahasiswa yang diberikan oleh pak Julan HERNADI: E, D, C,
B-, B, A-, A. Nilai-nilai ini dapat diurutkan, misalnya nilai A lebih baik dari nilai B,
tetapi seberapa besar selisih antara A dan B tidak dapat ditentukan. Jelasnya A- B tidak
bermakna.
2. Transparency International Indonesia (TII) baru-baru ini mengumumkan ranking
indeks persepsi korupsi (IPK) untuk 50 kota yang ada di Indonesia. Dari ke 50 kota
tersebut, Yogyakarta menduduki kota terbersih pada ranking pertama, disusul
Palangkaraya pada rakning kedua, Banda Aceh pada ranking ketiga dan seterusnya
sampai Kupang pada ranking ke 50 atau terkorup. Data ranking di sini merupakan
level pengukuran ordinal. Walaupun ada angka di sini namun selisih antara ranking 2 dan
ranking 1, bila ditulis dalam bentuk 2-1 = 1 tidak mempunyai makna sama sekali.
LEVEL INTERVAL seprerti level ordinal dengan sifat tambahannya adalah selisih antara dua
data mempunyai makna. Tetapi level ini tidak mempunyai titik nol alami sebagai titik awal.
LEVEL RASIO seperti level interval namun ia mempunyai titik nol alami sebagai titik awal.
Data dari level rasio, data data dapat dibandingkan (selisih) dan dirasiokan (pembagian).
SOAL-SOAL LATIHAN:
2. [DATA KONTINU dan DATA DISKRIT] Bedakan apakah nilai (angka berikut)
sebagai data kontinu atau data diskrit.
a. Gaji yang diperoleh oleh pekerja Indonesia di luar negeri mencapai
3.000.000,- rupiah setiap bulannya.
b. Dalam 1560 orang pria yang disurvey ditemukan 38% dari mereka adalah
perokok aktif.
c. Suatu sampel terdiri dari sejumlah mobil, ditemukan bahwa rata-rata
beratnya adalah 1500 kg.
4. [SAMPEL – POPULASI] Tentukan yang mana sampel dan yang mana populasinya.
Tentukan juga sampel mana yang paling mungkin sebagai representasi dari populasinya.
a. A reporter for Newsweek stands on a street corner and asks 10 adults if they feel
that the current president is doing a good job.
b. Nielsen Media Research surveys 5000 randomly selected households and finds
that among the TV sets in use, 19% are tuned to 60 Minutes (based on data from
USA Today).
c. In a Gallup poll of 1059 randomly selected adults, 39% answered “yes”
when asked “Do you have a gun in your home?
d. A graduate student at the University of Newport conducts a research project
about how adult Americans communicate. She begins with a survey mailed
to 500 of the adults that she knows. She asks them to mail back a response to this
question: “Do you prefer to use e-mail or snail mail (the U.S. Postal Service)?”
She gets back 65 responses,