Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Chi-Square

STATISTIKA INFERENSIAL Materi: Distribusi Dan Uji Chi-Square (� ) Ir. GINANJAR SYAMSUAR, ME SEKOLAH TINGGI ILMU EKONOMI INDONESIA (STEI) – JAKARTA 2017 DISTRIBUSI DAN UJI CHI-SQUARE (� ) A. DISTRIBUSI CHI-SQUARE (� ) Distribusi khi-kuadrat (Chi-square distribution) atau distribusi χ² dengan � derajat bebas adalah distribusi jumlah kuadrat � peubah acak normal baku yang saling bebas. Fungsi kepekatan (density) distribusi khi-kuadrat dirumuskan sebagai berikut: � � = � � � � � − − � Jadi pada dasarnya Grafik distribusi khi-kuadrat bergantung pada derajat kebebasan � (db), yang umumnya merupakan kurva positif dan miring ke kanan. Kemiringan kurva ini akan semakin berkurang jika derajat kebebasasan � makin besar. Untuk � =1 dan � =2, bentuk kurvanya berlainan daripada untuk � ≥ . Distribusi khi-kuadrat mempunyai rata-rata dan variansi sebagai berikut : Rata-rata Variansi : μ = E(χ2) = � : σ2 = 2 � V-1 Probablitas suatu sampel acak yang menghasilkan nilai χ2 yang lebih besar dari suatu nilai tertentu, sama dengan luas daerah di bawah kurva di sebelah kanan nilai tersebut. Nilai tertentu tersebut biasanya ditulis dengan χ2α. Dengan demikian χ2α menyatakan nilai χ2α yang luas di sebelah kanannya sama dengan α. Daerah yang luasnya sama dengan α ini dinyatakan oleh daerah yang diarsir Nilai-nilai kritis χ2α untuk berbagai nilai α dan derajat kebebasan � tersedia pada tabel distribsi chi-kuadrat. (Terlampir)  Untuk α = 0,05, disebelah kanan, dan � = 10, maka nilai kritis χ20,05 = 18,307. Karena kurva distribusi chi-kuadrat tidak simetri, maka luas daerah di sebelah kiri harus dicari. Luas daerah sebelah kiri, yaitu 1 – α = 1- 0,05 = 0,95. Derajat kebebasan � =10, maka diperoleh χ20,95 = 3,940  Bila x , x , x , …, xn merupakan variabel acak yang masing-masing terdistribusi normal dengan rata-rata μ dan variansi σ2 dan semua variabel acak tersebut bebas satu sama lain, maka variabel acak berikut ini: = ∑( = −� ) � mempunyai distribusi chi-kuadrat dengan derajat kebebasan � =n.  Bila diambil sampel acak berukuran n dari populasi berdistribusi normal dengan rata-rata μ dan variansi σ2, dan pada setiap sampel tersebut dihitung variansi S2, maka variabel acak berikut ini, yaitu : V-2 − � � = � mempunyai distribsi chi-kuadrat χ2 dengan deraja kebebasan � = n-1 INTERVAL KEPERCAYAAN � = − � � Secara umum, interval kepercayaan untuk χ2 sebesar 1- α dinyatakan sebagai �( −�⁄ ) < � < �� ⁄ = −� Nilai kritis χ21- α/2 membatasi luas daerah di sebeleah kanan sebesar 1 - α/2 pada derajat kebebasan � = n.-1. Sedangkan nilai kritis χ2 α/2 membatasi luas daerah di sebelah kanan sebesar α/2 pada derajat kebebasan � = n-1. Dengan mensubstitusikan nilai (n-i)S2 maka diperoleh − �� ⁄ � <� < � − −�⁄ � = −� B. UJI CHI-SQUARE (� ) Beberapa manfaat dari distribusi chi-kuadrat, yaitu antara lain: 1. Uji Kecocokan (Goodness of fit test) a. Untuk menguji apakah data sampel mempunyai distribusi yang mendekati distribusi teoritis tertentu atau distribusi hipotesis tertentu (distribusi populasi), seperti distribusi binomial, distribusi poisson, atau distribusi normal. b. Untuk menguji apakah frekuensi yang diamati (observasi) berbeda secara signifikan dengan frekuensi teoritis atau frekuensi yang diharapkan. 2. Uji Independensi Untuk menguji kebebasan antar faktor variabel data dalam daftar kontingensi. 3. Uji Proporsi Untuk menguji proporsi antar faktor variabel data dalam daftar kontingensi, uji proporsi dengan uji independesi berbeda hanya pada formulasi hipotesisnya. V-3 1. Uji Kecocokan (Goodness of fit test) a. Uji Distribusi (Kesesuaian distribusi data) Untuk menguji apakah data sampel mempunyai distribusi yang mendekati distribusi teoritis tertentu atau distribusi hipotesis tertentu (distribusi populasi), seperti distribusi binomial, distribusi poisson, atau distribusi normal. Secara Umum: Misalkan terdapat sebuah sampel acak berukuran n dimana didalamnya terdapat k kategori yaitu A1 , A2, A3, …, Ak dan masing-masing kategori mempunyai o1,o2,…ok pengamatan. Probabilitas masing-masing kategori dapat ditentukan sesuai dengan distribusi yang ada dalam hipotesis nol sehingga frekuensi harapan untuk masing-masing kategori dapat dihitung, yaitu : � = ��� ; pi=Pr(Ai) , i=1,2,…,k � + � + ⋯+ � = � KATEGORI Frekuensi Observasi (Oi) Frekuensi Harapan (ei) dan � + � + ⋯ + � = A1 … A2 O1 O2 e1 e2 Ak … Ok … ek Langkah-langkah dalam pengujian ini adalah: 1. Formulasi hipotesis: Ho: : Distribusi X ialah F(x) H1 : Distribusi X bukan F(x) 2. Tentukan tingkat signifikasi  3. Tentukan frekuensi pengamatan Oi 4. Hitung frekuensi harapan Ho benar) � = ��� (frekuensi yang diharapkan jika 5. Hitung statistik uji: � � =∑ − − ; ∑ =∑ = V-4 X2 berdistribusi khi-kuadrat dengan derajat bebas ( d.b ) v, dimana: a. v = k-1 jika frekuensi harapan dapat dihitung tanpa mengestimasi parameter populasi dari statistik sampel. Pengurangan dengan 1 dari k karena berdasarkan kondisi ∑ �� = ∑ � = �, yang artinya jika k-1 frekuensi harapan telah diketahui, maka frekuensi harapan yang tersisa dapat dihitung karena jumlah semua frekuensi harapan harus sama dengan n. b. V=k-m-1, jika frekuensi harapan dapat dihitung hanya dengan mengestimasi m parameter populasi dari statistik sampel. k : banyak katagori ; m : banyak parameter yang diduga 6. Bandingkan nilai statistik penguji X2 dengan nilai kritik X,k-m-1 Keputusan: Jika � � ≥ � �; − − maka Ho ditolak. 7. Buat kesimpulan. Pendekatan pada distribusi khi-kuadrat ini baik jika frekuensi harapan setiap katagori/sel ≥ 5. Bila ada frekuensi harapan yang kurang dari 5, sebaiknya sel-sel yang berdekatan digabung. Contoh Seorang manager sedang meneliti banyaknya kedatangan pelanggan pada pasar swalayan yang dia pimpin. Pengamatan dilakukan berdasarkan periode waktu lima menit.Dalam periode ini dihitung banyaknya pelanggan yang datang.Dari suatu sampel 500 periode lima menitan ini terdapat 22 ,74, 115 , 95 , 94 , 80 dan 20 periode dimana masing-masing terdapat 0 , 1 , 2 , 3 , 4 , 5 dan lebih dari 5 pelanggan yang datang. Berdasarkan data diatas, apakah dapat disimpulkan bahwa banyaknya pelanggan yang datang per periode 5 menitan berdistribusi Poisson dengan μ= ? Gunakan =0.05 Jawab X : banyak pelanggan yang datang per periode Banyak pelanggan ( X ) 0 1 2 3 4 5 >5 Banyak periode 22 74 115 95 94 80 20 ( Oi ) 1. Hipotesis: Ho: X berdistribusi Poisson dengan μ=3 H1 : Tidak demikian 2. Tingkat signifikansi =0.05. 3. Menghitung nilai-nilai ei. V-5 Untuk menghitung frekuensi harapan menghitung pi . p1  P  X  0  0,0498  e1  np1   500 0,0498  24,9  e2  74,65 p2  0,1493 p3 = 0,2241 ; p7 = 0,0839 e3  112,05 e7  41,95 ; ei , terlebih dahulu kita harus p4 = 0,2240 ; p5 = 0,1681 ; p6 = 0,1008 ; e4  112 ; e5  84,05 ; e6  50, 4 ; 4. Hitung Statistik uji:   7 2 i 1  oi  ei  2 ei � �  22  24,9  d.b = 7-1= 6 24,9 =∑ 2 − −  20  41,95    41,95 2 = 33,049 2  12,592 . ;   0,05 . Nilai kritik : 0,05;6 5. Keputusan: Karena  2  33,049 > 12,592 maka H 0 ditolak pada   0,05 . 6. Kesimpulan : Banyaknya pelanggan yang datang per periode waktu lima menit tidak mengikuti distribusi Poisson dengan   3 . b. Uji Kesesuaian frekuensi data observasi dengan frekuensi harapan Contoh: Sebuah mesin pencampur adonan es krim akan menghasilkan perbandingan antara Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1. Jika 500 kg adonan yang dihasilkan, diketahui mengandung 275 kg Coklat, 95 kg Gula, 70 kg Susu dan 60 kg Krim, apakah mesin itu bekerja sesuai dengan perbandingan yang telah ditentukan? Lakukan pengujian dengan taraf nyata = 1 %. Solusi : 1. H0 : perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 : 1 H1 : perbandingan Coklat : Gula : Susu : Krim  5 : 2 : 2 : 1 2. Statistik Uji ² 3. Nilai  = 1 % = 0.01 4. Nilai Tabel ² V-6 k = 4; db =k -1 = 4-1= 3 db = 3;  = 0.01  ² tabel = 11.3449 5. Wilayah Kritis = Penolakan H0 jika ² hitung > ² tabel (db; ) ² hitung > 11.3449 6. Perhitungan ² � � =∑ − − kategori: Oi ei*) (Oi-ei) (Oi-ei)² (Oi-ei)²/ei Coklat 275 250 25 625 2.50 Gula 95 100 -5 25 0.25 Susu 70 100 -30 900 9.00 Krim 60 50 10 100 2.00 500 500 13.75  *) Perbandingan Coklat : Gula : Susu : Krim = 5 : 2 : 2 :1 Dari 500 kg adonan  Nilai ekspektasi Coklat = 5/10 x 500 = 250 kg Nilai ekspektasi Gula = 2/10 x 500 = 100 kg Nilai ekspektasi Susu = 2/10 x 500 = 100 kg Nilai ekspektasi Krim = 1/10 x 500 = 50 kg ² hitung = 13.75 7. Keputusan: ² hitung > ² tabel ( 13.75 > 11.3449) H0 ditolak, H1 diterima. 8. Kesimpulan: Perbandingan Coklat : Gula : Susu : Krim  5 : 2 : 2 :1 V-7 2. Uji Independensi (Kebebasan antar variabel) Uji ini digunakan untuk menguji hipotesis mengenai ada atau tidak adanya hubungan (asosiasi)atau kaitan antara dua faktor. Misalnya, apakah prestasi belajar mahasiswa ada hubungan dengan kondisi sosial ekonomi orang tuanya, apakah agama yang dipeluk ada hubungannya dengan ketaatan beribadah. Jika tidak ada hubungan antar dua faktor tersebut, maka dikatkan bahwa dua faktor itu saling bebas atau independen. Prosedur chi-kuadrat dapat dipakai juga untuk menguji ada tidaknya pengaruh dari satu faktor terhadap faktor lainnya. Contoh: Misalkan dilakukan survei pada 1.000 orang di Jakarta dan ingin diketahui apakah penghasilan masyarakat ada hubungannya dengan tingkat pendidikan. Penghasilan sebagai faktor 1 dan pendidikan sebagai faktor 2. Penghasilan dibedakan menjadi dua katagori, yaitu penghasilan rendah dan tinggi. Sedangkan pendidikan dibagi menjadi tiga tingkat, yaitu SMU ke bawah, sarjana muda, dan sarjana (termasuk pasca sarjana). Hasil survey tersebut disajikan pada tabel kontingensi berikut : Penghasilan Rendah Tinggi Total Kolom SMU kebawah 182 154 336 Pendidikan Sarjana muda 213 138 351 Total Baris Sarjana 203 110 313 598 402 1.000 Tabel di atas adalah tabel kontingensi berukuran 2 x 3, yang terdiri dari 2 baris dan 3 kolom. Bilangan dalam sel disebut frekuensi yang diobservasi, sedangkan totalnya disebut frekuensi marjinal. Untuk menguji kebebasan dua faktor digunakan statistik hitung: � � � = ∑∑ = − − b = Jml baris dan k = jml kolom, sehingga derajat kebebasan � = (b – 1) (k – 1). fe = frekuensi harapan = jumlah menurut baris x jumlah menurut kolom/ jumlah total. Jika nilai χ2h > χ2α, maka hipotesis nol (Ho) ditolak sedangkan jika tidak, maka hipotesis nol (Ho) diterima. V-8 Dengan demikian frekuensi yang diobservasi dan yang diharapkan secara lengkap adalah sebagai berikut: Hitung frekuensi harapan masing-masing sel sbb.: � � � � � � = � � �� � = � � �� � = � � �� � � � � = � � �� � = � � �� � � � � � � � � � � � � � � � �� � = � � � Penghasilan Rendah Tinggi Total Kolom � � �� � � � � �� � � � � �� � � � � �� � � � � �� � � � � �� � � = ∗ = ∗ = ∗ = ∗ = ∗ = ∗ = . = . = = = = . . . . Pendidikan SMU kebawah Sarjana muda Sarjana 182 213 203 (200.9) (209.9) (187.2) 154 138 110 (135.1) (141.1) (125.8) 336 351 313 Total Baris 598 402 1.000 1. Ho: dua faktor saling bebas, penghasilan saling bebas dengan pendidikan. H1: dua faktor tidak saling bebas 2. Taraf signifikansi = 5% dan � = (2-1) x (3-1) = 2, maka χ2tabel = 5.99146 3. Statistik Uji hitung: � � =∑= ∑= − . . + 4. Keputusan: − − . . =∑= − . . − − = . . − . . − . . = . Karena Nilai χ2h > χ2α, maka disimpulkan Ho ditolak pada taraf signifikansi 5%. 5. Kesimpulan: Antara penghasilan dan pendidikan masyarakat tidak saling bebas pada taraf signifikansi 5%. V-9 3. Uji Proporsi Contoh: Berikut adalah data proporsi penyiaran film (satuan pengukuran dalam persentase (%) jam siaran TV) di 3 stasiun TV. Apakah proporsi pemutaran Film India, Kungfu dan Latin di ketiga stasiun Tv tersebut sama? Lakukan Pengujian proporsi dengan Taraf Nyata = 2.5 % ATV (%) 4.17 4.5 3.33 2.5 2.50 3.0 Film India Film Kungfu Film Latin BTV (%) CTV (%) 2.92 2.92 3.5 Total Baris (%) 2.0 2.33 10 2.33 1.0 4.5 1.75 8 1.75 2.5 0.5 Total Kolom (%) 10 7 7 *) Nilai dalam kotak kecil adalah frekuensi ekspektasi Perhatikan cara mendapatkan frekuensi ekspektasi! 6 Total Observasi (%) = 24 Ukuran Tabel Kontingensi di atas = 3 x 3( 3 baris dan 3 kolom) db = (3-1)(3-1) = 2 x 2 = 4 Solusi : 1. Ho : Proporsi pemutaran film India, Kungfu dan Latin di ketiga stasiun TV adalah sama. H1 : Ada proporsi pemutaran film India, Kunfu dan Latin di ketiga stasiun TV yang tidak sama. 2. Statistik Uji = ² 3. Nilai  = 2.5 % = 0.025 4. Nilai Tabel ² db = 4;  = 0.025  ² tabel = 11.1433 5. Wilayah Kritis : Penolakan H0 6. Perhitungan ² frekuensi harapan untuk India, ATV = Latin, ATV = � � = .  ² hitung > ² tabel ² hitung > 11.1433 Kungfu, ATV = � = . = . V-10 � India, BTV = Latin,BTV = India,CTV= Latin, CTV = � � � = . = . = . Kungfu,BTV = � = . Kungfu,CTV= � = . = . Tabel perhitungan ² berikut kategori : Ind,ATV Kf,ATV Lat,ATV Ind,BTV Kf,BTV Lat,BTC Ind,CTV Kf,CTV Lat,CTV  7. Oi 4.5 2.5 3.0 3.5 1.0 2.5 2.0 4.5 0.5 24 ei 4.17 3.33 2.50 2.92 2.33 1.75 2.92 2.33 1.75 ------ (Oi-ei) 0.33 -0.83 0.50 -0.58 -1.33 0.75 -0.92 2.17 -1.25 ------- (Oi-ei)² 0.1089 0.6889 0.2500 0.3364 1.7689 0.5625 0.8464 4.7089 1.5625 --------- (Oi-ei)²/ei 0.1089/4.17 = 0.0261 0.2069 0.1000 0.1152 0.7592 0.3214 0.2899 2.0201 0.8929 ² hitung = 4.7317 Kesimpulan : ² hitung terletak di daerah penerimaan Ho. Ho diterima, proporsi pemutaran ketiga jenis film di ketiga s stasiun TV adalah sama. V-11 SOAL LATIHAN: No.1: PT Kiwi Sentosa adalah perusahaan transportasi untuk buah-buahan dari Madiun ke Jakarta. Perusahaan menginginkan kerusakan buah yang diangkut tidak sampai 15%. Berikut ini adalah data buah yang rusak selama 6 bulan terakhir. Data Prosentase Kesrusakan Buah per bulan Bulan % Kerusakan Buah 1 9 2 12 3 14 4 15 5 18 6 16 Dari data tersebut, Ujilah apakah masih sesuai harapan dari perusahaan dengan taraf nyata 1%. No.2: Pemerintah menghendaki bahwa inflasi pada tahun 2003 sebesar 8% pertahun. Data tahun 2003 inflasi dibeberapa kota besar adalah sebagai berikut: Kota Inflasi (%) Medan 9.49 Palembang 12.25 Padang 10.22 Jakarta 9.08 Bandung 11.97 Semarang 13.56 Surabaya 9.15 Denpasar 12.49 Banjarmasin 9.18 Makasar 8.25 Menado 15.22 Dengan data tersebut apakah target atau harapan pemerintah masih sesuai dengan kondisi sebenarnya dengan taraf nyata 5%? No.3: Sebuah perusahaan yang memiliki empat lokasi produksi ingin mengetahui apakah proporsi tenaga kerja terampil pada masing-masing lokasi sama. Data untuk menyelidiki proporsi tenaga kerja terampil tertera pada tabel 1. dibawah. Susunlah hipotesisnya, lalu uji secara statistik pada taraf nyata signifikansi α=5%. Tabel 1. Daftar Tenaga Terampil dan Tidak Terampil pada empat Lokasi Produksi Lokasi Produksi Tenaga Kerja A B C Terampil Tidak Terampil 89 161 99 151 193 148 D 82 168 V-1 No.4: Suatu contoh acak 310 orang dewasa diklasifikasikan menurut tingkat pendidikan dan tingkat kepercayaan terhadap adanya alam gaib sesuai tabel dibawah . Susunlah hipotesisnya, lalu uji secara statistik apakah percaya-tidaknya seseorang terhadap alam gaib tergantung atau tidak tergantung pada tingkat pendidikannya. Gunakan taraf uji α=1%. Tingkat Kepercayaan Percaya Tidak Percaya*) Ragu-ragu Total *) SD-SMP 50 35 20 105 Tingkat Pendidikan SMU Perguruan Tinggi 30 25 45 65 20 20 95 110 Total 105 145 60 310 Meyakini hanya Allah/Tuhan saja yang gaib selain itu tidak ada hal gaib. V-2 Tabel Distribusi Chi-Square α df 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 � 0.25 0.10 0.05 0.010 0.005 0.001 1.32330 2.77259 4.10834 5.38527 6.62568 7.84080 9.03715 10.21885 11.38875 12.54886 13.70069 14.84540 15.98391 17.11693 18.24509 19.36886 20.48868 21.60489 22.71781 23.82769 24.93478 26.03927 27.14134 28.24115 29.33885 30.43457 31.52841 32.62049 33.71091 34.79974 35.88708 36.97298 38.05753 39.14078 40.22279 41.30362 42.38331 43.46191 44.53946 45.61601 46.69160 47.76625 48.84001 49.91290 50.98495 52.05619 53.12666 54.19636 55.26534 56.33360 2.70554 4.60517 6.25139 7.77944 9.23636 10.64464 12.01704 13.36157 14.68366 15.98718 17.27501 18.54935 19.81193 21.06414 22.30713 23.54183 24.76904 25.98942 27.20357 28.41198 29.61509 30.81328 32.00690 33.19624 34.38159 35.56317 36.74122 37.91592 39.08747 40.25602 41.42174 42.58475 43.74518 44.90316 46.05879 47.21217 48.36341 49.51258 50.65977 51.80506 52.94851 54.09020 55.23019 56.36854 57.50530 58.64054 59.77429 60.90661 62.03754 63.16712 3.84146 5.99146 7.81473 9.48773 11.07050 12.59159 14.06714 15.50731 16.91898 18.30704 19.67514 21.02607 22.36203 23.68479 24.99579 26.29623 27.58711 28.86930 30.14353 31.41043 32.67057 33.92444 35.17246 36.41503 37.65248 38.88514 40.11327 41.33714 42.55697 43.77297 44.98534 46.19426 47.39988 48.60237 49.80185 50.99846 52.19232 53.38354 54.57223 55.75848 56.94239 58.12404 59.30351 60.48089 61.65623 62.82962 64.00111 65.17077 66.33865 67.50481 6.63490 9.21034 11.34487 13.27670 15.08627 16.81189 18.47531 20.09024 21.66599 23.20925 24.72497 26.21697 27.68825 29.14124 30.57791 31.99993 33.40866 34.80531 36.19087 37.56623 38.93217 40.28936 41.63840 42.97982 44.31410 45.64168 46.96294 48.27824 49.58788 50.89218 52.19139 53.48577 54.77554 56.06091 57.34207 58.61921 59.89250 61.16209 62.42812 63.69074 64.95007 66.20624 67.45935 68.70951 69.95683 71.20140 72.44331 73.68264 74.91947 76.15389 7.87944 10.59663 12.83816 14.86026 16.74960 18.54758 20.27774 21.95495 23.58935 25.18818 26.75685 28.29952 29.81947 31.31935 32.80132 34.26719 35.71847 37.15645 38.58226 39.99685 41.40106 42.79565 44.18128 45.55851 46.92789 48.28988 49.64492 50.99338 52.33562 53.67196 55.00270 56.32811 57.64845 58.96393 60.27477 61.58118 62.88334 64.18141 65.47557 66.76596 68.05273 69.33600 70.61590 71.89255 73.16606 74.43654 75.70407 76.96877 78.23071 79.48998 10.82757 13.81551 16.26624 18.46683 20.51501 22.45774 24.32189 26.12448 27.87716 29.58830 31.26413 32.90949 34.52818 36.12327 37.69730 39.25235 40.79022 42.31240 43.82020 45.31475 46.79704 48.26794 49.72823 51.17860 52.61966 54.05196 55.47602 56.89229 58.30117 59.70306 61.09831 62.48722 63.87010 65.24722 66.61883 67.98517 69.34645 70.70289 72.05466 73.40196 74.74494 76.08376 77.41858 78.74952 80.07673 81.40033 82.72042 84.03713 85.35056 86.66082 V-3