Sampling Replacement
Sampling Replacement
Sampling Replacement
Consider a population of potato sacks, each of which has either 12, 13, 14, 15, 16, 17, or
18 potatoes, and all the values are equally likely. Suppose that, in this population, there is
exactly one sack with each number. So the whole population has seven sacks. If I sample
two with replacement, then I first pick one (say 14). I had a 1/7 probability of choosing
that one. Then I replace it. Then I pick another. Every one of them still has 1/7
probability of being chosen. And there are exactly 49 different possibilities here
(assuming we distinguish between the first and second.) They are: (12,12), (12,13), (12,
14), (12,15), (12,16), (12,17), (12,18), (13,12), (13,13), (13,14), etc.
Consider the same population of potato sacks, each of which has either 12, 13, 14, 15, 16,
17, or 18 potatoes, and all the values are equally likely. Suppose that, in this population,
there is exactly one sack with each number. So the whole population has seven sacks. If I
sample two without replacement, then I first pick one (say 14). I had a 1/7 probability of
choosing that one. Then I pick another. At this point, there are only six possibilities: 12,
13, 15, 16, 17, and 18. So there are only 42 different possibilities here (again assuming
that we distinguish between the first and the second.) They are: (12,13), (12,14), (12,15),
(12,16), (12,17), (12,18), (13,12), (13,14), (13,15), etc.
When we sample with replacement, the two sample values are independent. Practically,
this means that what we get on the first one doesn't affect what we get on the second.
Mathematically, this means that the covariance between the two is zero.
In sampling without replacement, the two sample values aren't independent. Practically,
this means that what we got on the for the first one affects what we can get for the second
one. Mathematically, this means that the covariance between the two isn't zero. That
complicates the computations. In particular, if we have a SRS (simple random sample)
without replacement, from a population with variance , then the covariance of two of
the different sample values is , where N is the population size. (A brief summary
of some formulas is provided here. For a discussion of this in a textbook for a course at
the level of M378K, see the chapter on Survey Sampling in Mathematical Statistics and
Data Analysis by John A. Rice, published by Wadsworth & Brooks/Cole Publishers.
There is an outline of an slick, simple, interesting, but indirect, proof in the problems at
the end of the chapter.)
Mary Parker.
Distribusi normal, disebut pula distribusi Gauss, adalah distribusi probabilitas yang
paling banyak digunakan dalam berbagai analisis statistika. Distribusi normal baku
adalah distribusi normal yang memiliki rata-rata nol dan simpangan baku satu. Distribusi
ini juga dijuluki kurva lonceng (bell curve) karena grafik fungsi kepekatan
probabilitasnya mirip dengan bentuk lonceng.
Distribusi normal memodelkan fenomena kuantitatif pada ilmu alam maupun ilmu sosial.
Beragam skor pengujian psikologi dan fenomena fisika seperti jumlah foton dapat
dihitung melalui pendekatan dengan mengikuti distribusi normal. Distribusi normal
banyak digunakan dalam berbagai bidang statistika, misalnya distribusi sampling rata-
rata akan mendekati normal, meski distribusi populasi yang diambil tidak berdistribusi
normal. Distribusi normal juga banyak digunakan dalam berbagai distribusi dalam
statistika, dan kebanyakan pengujian hipotesis mengasumsikan normalitas suatu data.
[sunting] Sejarah
Distribusi normal pertama kali diperkenalkan oleh Abraham de Moivre dalam artikelnya
pada tahun 1733 sebagai pendekatan distribusi binomial untuk n besar. Karya tersebut
dikembangkan lebih lanjut oleh Pierre Simon de Laplace, dan dikenal sebagai teorema
Moivre-Laplace. Laplace menggunakan distribusi normal untuk analisis galat suatu
eksperimen. Metode kuadrat terkecil diperkenalkan oleh Legendre pada tahun 1805.
Sementara itu Gauss mengklaim telah menggunakan metode tersebut sejak tahun 1794
dengan mengasumsikan galatnya memiliki distribusi normal.
Istilah kurva lonceng diperkenalkan oleh Jouffret pada tahun 1872 untuk distribusi
normal bivariat. Sementara itu istilah distribusi normal secara terpisah diperkenalkan
oleh Charles S. Peirce, Francis Galton, dan Wilhelm Lexis sekitar tahun 1875.
Terminologi ini secara tidak sengaja memiliki nama sama.
A. VALIDITAS
Masalah validitas berhubungan dengan sejauh mana suatu alat mampu mengukur apa
yang dianggap orang seharusnya diukur oleh alat tersebut. Definisi yang paling lazim
mengenai validitas tercerminkan dalam pertanyaan: Apakah kita benar-benar mengukur
apa yang ingin kita ukur? Dalam pertanyaan ini yang ditekankan adalah apa yang sedang
diukur (Kerlinger, 1986).
Validitsa relasi-kruteria dikaji dengan cara membandingkan skor tes atau skala dengan
atu atau lebih peubah ekstra (Variabel eksternal) atau kriteria yang diketahui (atau
diyakini) merupakan pengukur atribut yang sedang dikaji. Yang lebih diperhatikan dalam
validasi relasi-kriteria adalah bukan apa yang diukur oleh tes tersebut melainkan
kemampuan test tersebut dalam membuat prediksi.
Pengujian validitas relasi-kriteria dapat dilakukan dengan mengkorelasikan suatu alat
ukur dengan kriteria lain yang dianggap (atau diyakini) merupakan pengukur atribut yang
sedang dikaji. Semakin tinggi korelasinya, maka makin baiklah validitasnya. Kesulitan
terbesar dalam hal validasi ini adalah bagaimana mendapatkan ktiteria yang digunakan
sebagai pembanding.
Jika peneliti mengajukan pertanyaan : “Apakah yang sebenarnya diukur oleh tes ini?”,
maka ia mepersoalkan validitas kontsrak tes tesebut. Validitas konstrak menunjuk kepada
sebarapa jauh suatu tes mengukur sifat atau bangunan-pengertian (construct) tertentu.
Validitas ini menghubungkan gagasan dan praktek psikometri dengan gagasan
teoritisnya. Suatu alat ukur yang berisi beberapa pertanyaan untuk mengukur suatu hal
(suatu konstrak tertentu), dikatakan valid (construct validity) jika setiap butir pertanyaan
yang menyusun kuisioner tersebut memiliki keterkaitan yang tinggi. Ukuran keterkaitan
antar butir pertanyaan ini umumnya dicerminkan oleh korelasi jawaban antar pertanyaan.
Pertanyaan yang memiliki korelasi rendah dengan butir pertanyaan yang lain, dinyatakan
sebagai pertanyaan yang tidak valid. Metode yang sering digunakan untuk memberikan
penilaian terhadap validitas konstrak adalah korelasi produk momen (Moment product
correlation/pearson correlation) antara skor setiap butir pertanyaan dengan skor total,
sehingga sering disebut inter item-total correlation. Formula yang digunakan untuk itu
adalah :
#maaf belum bisa menampilkan rumus-rumus#
B. RELIABILITAS
Reliabilitas atau keterandalan merupakan suatu ukuran yang digunakan untuk menilai
apakah alat ukur yang digunakan mampu memberikan nilai pengukuran yang konsisten,
atau dengan kata lain reliabilitas merupakan peluang mendapatkan hasil yang sama pada
pengukuran yang dilakukan berulangkali. Alat ukur terandal jika indeks keterandalannya
lebih besar dari 0.70.
1. Pendekatan Eksternal
a. Test-retest
Respon diambil dua kali dalam waktu yang dekat (kondisi responden relatif sama)
b. Alternative Form
Respon dimabil dua kali pada waktu bersamaan dengan menggunakan alat ukur yang
berbeda
Indeks Reliabilitas untuk pendekatan eksternal:
- Teknik Kesesuaian : P = Jumlah jawaban sama / Jumlah responden X 100%
- Teknik Korelasi : #maaf belum bisa menampilkan rumus-rumus#
2. Pendekatan Internal
a. Cronbach Aplha #maaf belum bisa menampilkan rumus-rumus#
b. Uji Belah dua (Split Half)
- Indeks Sperman-Brown #maaf belum bisa menampilkan rumus-rumus#
- Indeks Guttman #maaf belum bisa menampilkan rumus-rumus#
nalisis data kategorik untuk peubah ganda (Multivariate) diawali dengan tabel
kontingensi. Perhitungan persentase kolom, baris, atau persentase total akan
mempermudah interpretasi hasil analisis.
Peubah-peubah dalam suatu tabel kontingensi dikatakan tidak berasosiasi atau saling
bebas jika sebaran persentasenya sama atau mendekati sama di masing-masing kolom
(pada persentase kolom). Sebaliknya jika sebaran persentase tidak sama maka peubah-
peubah berasosiasi dengan tingkat asosiasi tertentu (Agung, 2001).
Korelasi
Korelasi adalah metode untuk mengetahui tingkat keeratan hubungan dua peubah atau
lebih yang digambarkan oleh besarnya koefisien korelasi.
Koefisien korelasi adalah koefisien yang menggambarkan tingkat keeratan hubungan
antar dua peubah atau lebih. Besaran dari koefisien korelasi tidak menggambarkan
hubungan sebab akibat antara dua peubah atau lebih, tetapi semata-mata menggambarkan
keterkaitan linier antar peubah. (Mattjik & Sumertajaya, 2000)
Nilai dari Koefisien korelasi berkisar antara -1 sampai dengan 1.
-1 berarti terdapat hubungan negatif (berkebalikan) yang sempurna
0 berarti tidak terdapat hubungan sama sekali
1 berarti terdapat hubungan positif yang sempurna
Banyak metode statistika untuk mengukur korelasi. Salah satu yang paling sering
digunakanadalah Korelasi Pearson. Ini merupakan Metode Parametrik sehingga
memerlukan pengujian asumsi, yaitu:
1. Data memiliki skala pengukuran interval atau rasio (harus numerik bukan kategorik)
2. Mengikuti Distribusi Normal
3. Memiliki hubungan linier
Apabila data Anda tidak memenuhi asumsi di atas maka gunakan korelasi yang lain,
yaitu:
1. Tau Kendall
2. Spearman
Analisis gerombol adalah analisis statistik peubah ganda yang digunakan apabila ada N
buah individu atau objek yang mempunyai p peubah dan N objek tersebut ingin
dikelompokkan ke dalam k kelompok berdasarkan sifat-sifat yang dimati sehingga
individu atau objek yang terletak dalam satu gerombol memiliki kemiripan sifat yang
lebih besar dibandingkan dengan individu yang terletak dalam gerombol lain (Dillon &
Goldstein, 1984).
Pengukuran jarak yang paling dikenal yaitu jarak Euclid yang digunakan jika tidak ada
korelasi antar peubah yang diminati. Jika tejadi korelasi antar peubah maka perlu
dilakukan Analisis Komponen Utama / Principle Component terlebih dahulu atau dapat
juga menggunakan konsep jarak lain seperti jarak Mahalanobis, dll.
Teknik penggerombolan terdiri dari hirarki dan tidak berhirarki. Teknik hirarki
digunakan untuk mencari struktur penggabungan dari objek-objek, sedangakan teknik
tidak berhirarki digunakan apabila jumlah gerombol yang diinginkan diketahui.
Teknik hirarki terdiri atas dua yaitu secara agglomerative (penggabungan), dimana
masing-masing objek dianggap satu kelompok kemudian antar kelompok yang jaraknya
berdekatan bergabung menjadi satu kelompok, dan secara divise (pemecahan) yaitu pada
awalnya semua objek berada dalam satu gerombol setelah itu sifat paling beda dipisahkan
dan membentuk satu gerombol yang lain. Porses berlanjut sampai semua objek tersebut
masing-masing membentuk satu gerombol.
Dalam proses penggabungan gerombol dengan metode hirarki selalu diikuti dengan
perbaikan matriks jarak / matriks kesamaan. Metode perbaikan jarak antar lain :
Single Lingkage
Metode ini mengelompokkan dua objek yang mempunyai jarak terdekat terlebih dahulu.
Complete Lingkage
Metode ini justru akan mengelompokkan dua objek yang mempunyai jarak terjauh
terlebih dahulu.
Average Lingkage
Metode ini akan mengelompokkan objek berdasar jarak rata-rata yang didapat dengan
melakukan rata-rata semua jarak objek terlebih dahulu.
Ward’s Method
Pada metode ini, jarak antar dua cluster yang terbentuk adalah sum of squares di antara
dua cluster tersebut.
Centroid Method
Pada metode ini, jarak antar dua cluster adalah jarak di antara centroid cluster-cluster
tersebut. Centroid adalah rata-rata jarak yang ada pada sebuah cluster, yang didapat
dengan melakukan rata-rata pada semua anggota suatu cluster tertentu. Dengan metode
ini, setiap terjadi cluster baru, segera terjadi perhitungan ulang centroid, sampai terbentuk
cluster tetap.
Hasil dari analisis disajikan dalam bentuk dendogram. Pemotongan dendogram dapat
dilakukan pada selisih jarak pengabungan yang terbesar.
1. Analisis Deskriptif
Meringkas Data, statistika 5 serangkai, Ukuran pemusatan,
ukuran keragaman data, dll
2. Charting, grafik
Pembuatan chart dan grafik apapun sesuai keinginan Anda
3. Tabulasi
Pembuatan berbagai macam tabel sesuai keinginan Anda
4. Uji Signifikan
Melakukan uji hipotesis terhadap berbagai permasalahan
Uji satu sampel, uji dua sempel, uji dua atau lebih sampel
5. Korelasi
Metode untuk mengetahui hubungan antar dua variabel,
satu variabel dengan lebih dari satu veriabel, dan juga
banyak variabel dengan banyak variabel.
6. Regresi
Metode untuk membuat suatu modelhubungan antara
satu variabel terikat (dependent variable) dengan satu atau
lebih variabel bebas (independent variable)
7. Multivariate Regression
Metode untuk membuat model hubungan antara banyak
variabel terikat (dependent variable) dan banyak variabel bebas
(independent variable)
8. Logit-Probit
Mirip dengan regresi namun dapat digunakan untuk variabel kategorik
(ordinal dan nominal), termasuk non parametrik
9. Experimental Design : keterangan menyusul
10. Non-Parametrik Analysis : keterangan menyusul
11. AKU : keterangan menyusul
12. Analisis Faktor : keterangan menyusul
13. Cluster Analysis : keterangan menyusul
14. Analisis Diskriminan : keterangan menyusul
15. Multidimensional Scaling : keterangan menyusul
16. Biplot : keterangan menyusul
17. Analisis Korespondency : keterangan menyusul
18. Time Series Anlysis : keterangan menyusul
19. Path Analysis : keterangan menyusul
20. SEM (Seqential Equation Modeling) : keterangan menyusul
21. CHAID : keterangan menyusul
22. AMMI : keterangan menyusul
23. Bootstrap : keterangan menyusul
Korelasi adalah metode untuk mengetahui tingkat keeratan hubungan dua peubah atau
lebih yang digambarkan oleh besarnya koefisien korelasi.
Koefisien korelasi adalah koefisien yang menggambarkan tingkat keeratan hubungan
antar dua peubah atau lebih. Besaran dari koefisien korelasi tidak menggambarkan
hubungan sebab akibat antara dua peubah atau lebih, tetapi semata-mata menggambarkan
keterkaitan linier antar peubah. (Mattjik & Sumertajaya, 2000)
Nilai dari Koefisien korelasi berkisar antara -1 sampai dengan 1.
-1 berarti terdapat hubungan negatif (berkebalikan) yang sempurna
0 berarti tidak terdapat hubungan sama sekali
1 berarti terdapat hubungan positif yang sempurna
Banyak metode statistika untuk mengukur korelasi. Salah satu yang paling sering
digunakanadalah Korelasi Pearson. Ini merupakan Metode Parametrik sehingga
memerlukan pengujian asumsi, yaitu:
1. Data memiliki skala pengukuran interval atau rasio (harus numerik bukan kategorik)
2. Mengikuti Distribusi Normal
3. Memiliki hubungan linier
Apabila data Anda tidak memenuhi asumsi di atas maka gunakan korelasi yang lain,
yaitu:
1. Tau Kendall
2. Spearman
Intinya, ANOVA dapat digunakan untuk menguji hipotesis dengan 2 variabel atau lebih.
Statistika : Suatu disiplin ilmu yang mempelajari metode pengumpulan, peringkasan dan
penyajian data, menganalisis (termasuk pendugaan parametrik) dan menarik kesimpulan
dari data tersebut.
SUMBER DATA
1. Data Primer : data yang diperoleh dari sumber asli dan dikumpuilkan secara khusus
untuk menjawab pertanyaan penelitian kita.
2. Data Sekunder : data yang berasal dar survei pihak lain.
Dalil Chebyshev :
“Sekurang-kurangnya 1 – 1/k2 bagian data terletak dalam k simpangan baku dari nilai
tengahnya.”
METODE STATISTIKA
Metode Statistika: Prosedur-prosedur yang digunakan dalam pengumpulan, penyajian,
analisis dan penafsiran data.
Pengelompokkan Metode Statistika :
1. Statistika deskriptif : metode-metode yang berkaitan dengan pengumpulan,
peringkasan dan penyajian suatu data sehingga memberikan informasi yang berguna dan
juga menatanya ke dalam bentuk yang siap untuk dianalisis.
2. Statistika inferensia : Mencakup semua metode yang berhubungan dengan analisis
sebagian data kemudian sampai pada peramalan atau penarikan kesimpulan mengenai
keseluruhan himpunan data induknya.
Apa yaaa hubungannya Do'a dan Statistika???
Mungkin banyak perdebatan mengenai hubungan sebab akibat seperti ini.
Apakah benar suatu hal menyebabkan hal lain atau sebaliknya.
Untuk menghindari berbagai perdebatan tersebut, Statistika mentransformasikan sebab-
akibat menjadi independen dan dependen variabel.
Metode yang mempelajari hubungan antara independen dan dependen variabel salah
satunya adalah Regresi.
nilai a merupakan nilai konstan apabila seseorang tidak melakukan apa-apa dia akan
mendapat nilai ujian a. Sedangkan b merupakan nilai koefisien dari
variabel independen yang merupakan bobot dari variabel independen tersebut dalam men
entukan nilai dependen variabel.
Model Regresi yang baik adalah model yang memiliki error terkecil. Namun hampir tidak
munkin mendapatkan nilai error = 0. Sebaik apapun usaha seseorang dalam mendapatkan
nilai ujian yang baik (x1, x2, x3, ..., xi), belum tentu mendapatkan nilai yang baik (y).
Pasti selalu ada variabel lain yang tidak bisa dikendalikan dan tidak masuk dalam model
regresi. Itulah yang dimaksud dengan komponen error. Seperti kemungkinan sakit pada
saat ujian, kemungkinan adanya kecelakaan pada saat ujian, dll.
y= a + bx + e
dapat berarti:
Apabila data Anda tidak memenuhi asumsi distribusi normal,
tipe data interval atau rasio, kehomogenan variance, dan
besarnya jumlah data maka jangan dipaksakan untuk menggunakan
Parametrik Test. Anda dapat menggunakan statistik non-parametrik.
Banyak Statistik Non-Parametrik yang dapat digunakan untuk
melakukan uji hipotesis sebagai berikut:
☻ Chi-Square Test
Uji ini bertujuan untuk mengetahui sebuah distribusi data dari sample mengikuti sebuah
distribusi teoritis tertentu ataukah tidak Distribution Test
Selain digunakan untuk menguji distribusiNote dari sebuah grup sample, Chi-square
Test juga dapat digunakan untuk menguji Kehomogenan dan Independensi dari dua buah
grup sample.
Homogenity Test
Uji digunakan untuk mengetahui apakah kedua populasi asal dari dua grup sample
homogen ataukah tidak.
Uji Independensi
Uji digunakan untuk memeriksa kebebasan/independensi dari dua variabel, sehingga kita
dapat menyimpulkan apakah kedua variabel tersebut saling bebas (tidak saling
mempengaruhi) ataukah keduanya saling bertalian (saling mempengaruhi).
Before using the sample size calculator, there are two terms that you need to know.
Sebelum menggunakan sampel ukuran kalkulator, ada dua hal yang harus Anda ketahui.
These are: confidence interval and confidence level . Ini adalah: interval keyakinan
dan tingkat keyakinan. If you are not familiar with these terms, click here . Jika Anda
tidak akrab dengan istilah tersebut, klik di sini. To learn more about the factors that affect
the size of confidence intervals, click here . Untuk mempelajari lebih lanjut tentang
faktor-faktor yang mempengaruhi ukuran interval keyakinan, klik di sini.
Enter your choices in a calculator below to find the sample size you need or the
confidence interval you have. Masukkan pilihan Anda di kalkulator di bawah ini untuk
menemukan sampel ukuran yang Anda butuhkan atau interval keyakinan anda miliki.
Leave the Population box blank if the population is very large or unknown. Biarkan
kosong jika kotak Populasi penduduk yang sangat besar atau tidak dikenal.
Sample Size Calculator Terms: Confidence Interval &
Confidence Level Ukuran sampel Kalkulator Syarat: Confidence
Interval Confidence & Tingkat
The confidence level tells you how sure you can be. Tingkat keyakinan yang
memberitahu Anda bagaimana Anda bisa yakin. It is expressed as a percentage and
represents how often the true percentage of the population who would pick an answer lies
within the confidence interval. Hal ini dinyatakan sebagai persentase dan mewakili
seberapa sering benar persentase dari populasi yang akan diambil yang terbaik terletak di
dalam interval keyakinan. The 95% confidence level means you can be 95% certain; the
99% confidence level means you can be 99% certain. Dengan tingkat keyakinan 95%
berarti Anda dapat 95% tertentu, dan tingkat keyakinan 99% berarti Anda dapat 99%
tertentu. Most researchers use the 95% confidence level. Sebagian besar peneliti
menggunakan tingkat keyakinan 95%.
When you put the confidence level and the confidence interval together, you can say that
you are 95% sure that the true percentage of the population is between 43% and 51%.
Bila Anda menempatkan tingkat keyakinan dan interval keyakinan bersama-sama, Anda
dapat berkata bahwa Anda adalah 95% yakin bahwa benar persentase dari populasi
adalah antara 43% dan 51%. The wider the confidence interval you are willing to accept,
the more certain you can be that the whole population answers would be within that
range. Yang lebih luas dengan interval keyakinan anda bersedia menerimanya, lebih
tertentu Anda dapat bahwa seluruh populasi jawaban akan di dalam jangkauan.
For example, if you asked a sample of 1000 people in a city which brand of cola they
preferred, and 60% said Brand A, you can be very certain that between 40 and 80% of all
the people in the city actually do prefer that brand, but you cannot be so sure that between
59 and 61% of the people in the city prefer the brand. Misalnya, jika Anda ditanya
sampel dari 1000 orang di sebuah kota yang merek cola pilihan mereka, dan 60% berkata
Merk A, Anda bisa sangat yakin bahwa antara 40 dan 80% dari semua orang di kota yang
sebenarnya lebih suka melakukan merek, namun Anda tidak dapat begitu yakin bahwa
antara 59 dan 61% dari orang-orang di kota lebih mengutamakan merek.
Factors that Affect Confidence Intervals Faktor-faktor yang
mempengaruhi Confidence interval
There are three factors that determine the size of the confidence interval for a given
confidence level: Ada tiga faktor yang menentukan besarnya interval keyakinan yang
diberikan untuk tingkat keyakinan:
The larger your sample size, the more sure you can be that their answers truly reflect the
population. Anda semakin besar ukuran sampel, semakin yakin bahwa mereka dapat
benar-benar mencerminkan jawaban penduduk. This indicates that for a given confidence
level, the larger your sample size, the smaller your confidence interval. Hal ini
menunjukkan bahwa untuk tingkat keyakinan yang diberikan, semakin besar ukuran
sampel anda, maka anda interval keyakinan lebih kecil. However, the relationship is not
linear ( ie , doubling the sample size does not halve the confidence interval). Namun,
hubungan yang tidak linear (yaitu, dua kali lipat ukuran sampel tidak separuhnya pada
interval keyakinan).
Percentage Persentase
Your accuracy also depends on the percentage of your sample that picks a particular
answer. Akurasi Anda juga bergantung pada persentase sampel yang terbaik picks
tertentu. If 99% of your sample said "Yes" and 1% said "No," the chances of error are
remote, irrespective of sample size. Jika 99% dari sampel mengatakan "Ya" dan 1%
menjawab "Tidak," kesempatan kesalahan yang jauh, terlepas dari ukuran sampel.
However, if the percentages are 51% and 49% the chances of error are much greater.
Namun, jika persentase adalah 51% dan 49% dari kemungkinan kesalahan yang jauh
lebih besar. It is easier to be sure of extreme answers than of middle-of-the-road ones.
Lebih mudah untuk memastikan jawaban yang ekstrim dibandingkan dari tengah-of-the-
jalan ones.
When determining the sample size needed for a given level of accuracy you must use the
worst case percentage (50%). Dalam menentukan ukuran sampel yang diperlukan untuk
suatu tingkat akurasi Anda harus menggunakan persentase kasus terburuk (50%). You
should also use this percentage if you want to determine a general level of accuracy for a
sample you already have. Anda juga harus menggunakan persentase ini jika Anda ingin
menentukan tingkat akurasi umum untuk sampel yang sudah ada. To determine the
confidence interval for a specific answer your sample has given, you can use the
percentage picking that answer and get a smaller interval. Untuk menentukan interval
keyakinan tertentu terbaik untuk Anda telah memberikan contoh, Anda bisa
menggunakan persentase memilih yang terbaik dan mendapatkan yang lebih kecil
interval.
How many people are there in the group your sample represents? Berapa banyak orang
yang ada dalam grup sampel mewakili Anda? This may be the number of people in a city
you are studying, the number of people who buy new cars, etc. Often you may not know
the exact population size. Hal ini mungkin jumlah orang di kota Anda belajar, jumlah
orang yang membeli mobil baru, dll Seringkali Anda mungkin tidak tahu persis ukuran
populasi. This is not a problem. Ini tidak menjadi masalah. The mathematics of
probability proves the size of the population is irrelevant unless the size of the sample
exceeds a few percent of the total population you are examining. Dari probabilitas
matematika yang membuktikan besarnya populasi yang tidak relevan, kecuali jika ukuran
sampel melebihi beberapa persen dari total populasi anda meneliti. This means that a
sample of 500 people is equally useful in examining the opinions of a state of 15,000,000
as it would a city of 100,000. Ini berarti sampel dari 500 orang yang sama-sama berguna
dalam meneliti dengan pendapat keadaan 15000000 karena akan kota 100.000. For this
reason, The Survey System ignores the population size when it is "large" or unknown.
Untuk alasan ini, The Survey Sistem mengabaikan penduduk bila ukuran "besar" atau
tidak dikenal. Population size is only likely to be a factor when you work with a
relatively small and known group of people ( eg , the members of an association). Ukuran
populasi hanya mungkin menjadi faktor ketika anda bekerja dengan relatif kecil dan
dikenal sekelompok orang (misalnya, para anggota dari sebuah asosiasi).
The confidence interval calculations assume you have a genuine random sample of the
relevant population. Dengan interval keyakinan perhitungan menganggap Anda memiliki
asli sampel acak dari populasi yang relevan. If your sample is not truly random, you
cannot rely on the intervals. Contoh jika Anda tidak benar-benar acak, Anda tidak dapat
bergantung pada interval. Non-random samples usually result from some flaw in the
sampling procedure. Non-biasanya hasil sampel acak dari beberapa cacat dalam sampel
prosedur. An example of such a flaw is to only call people during the day and miss
almost everyone who works. Contoh seperti ini cacat adalah hanya untuk panggilan orang
sepanjang hari dan hampir semua orang yang kehilangan pekerjaan. For most purposes,
the non-working population cannot be assumed to accurately represent the entire
(working and non-working) population. Bagi kebanyakan tujuan, mereka yang bukan
penduduk bekerja tidak dapat diasumsikan secara akurat mewakili seluruh (bekerja dan
tidak bekerja) penduduk.