Pruebas de Bondad de Ajuste y Tablas de Contingencia
Pruebas de Bondad de Ajuste y Tablas de Contingencia
Pruebas de Bondad de Ajuste y Tablas de Contingencia
INTRODUCCIN Recordemos que una hiptesis estadstica es una afirmacin con respecto a una caracterstica que se desconoce de una poblacin de inters. Hasta ahora se han estudiado en forma exclusiva hiptesis acerca del valor de algn parmetro desconocido. En esta clase se examinarn las pruebas de hiptesis estadsticas en las que las caractersticas que se desconoce es alguna propiedad de la forma funcional de la distribucin que se muestrea. Adems se discutirn pruebas de independencia entre dos variables en las cuales la evidencia muestral se obtiene mediante la clasificacin de cada variable en un cierto nmero de categoras. En forma tradicional, este tipo de pruebas recibe el nombre de bondad de ajuste ya que sta compara los resultados de una muestra aleatoria con aquellos que se espera observar si la hiptesis nula es correcta. La comparacin se hace mediante la clasificacin de los datos que se observan en cierto nmero de categoras y entonces comparando las frecuencias observadas con las esperadas con cada categora. Para un tamao especfico del error de tipo I, la hiptesis nula ser rechazada si existe una diferencia suficiente entre las frecuencias observadas y las esperadas. PRUEBA DE BONDAD DE AJUSTE CHI CUADRADO Una prueba de bondad de ajuste se emplea para decidir cundo un conjunto de datos se apega a una distribucin de probabilidad dada. Sea P una poblacin en estudio que admite las categoras que: Sea . la probabilidad que tericamente asignamos a la ocurrencia de la categora tal que: a. b. para mutuamente excluyentes, tal
Supongamos que se toma una muestra aleatoria de tamao n de la poblacin, de modo que denota el nmero de elementos de la muestra que presenta la categora observada). Cuando la hiptesis nula es verdadera, el nmero esperado de observaciones del tipo es: donde , (frecuencia
La diferencia entre las frecuencias observadas y las esperadas tiende a ser bastante pequea cuando es verdadera y grande cuando es falsa.
Se aproxima a la distribucin chi cuadrado, con k-1 grados de libertad. Ejemplo 1: El gerente de una planta industrial pretende determinar si el nmero de empleados que asisten al consultorio mdico de la planta se encuentra distribuido de forma equitativa durante los cinco das de trabajo de la semana. Con base en una muestra aleatoria de cuatro semanas completas de trabajo, se observ el siguiente nmero de consultas:
Lunes 49
Viernes 45
Con
existe alguna razn para creer que el nmero de empleados que asisten al
consultorio mdico no se encuentra distribuido en forma equitativa durante los das de trabajo de la semana? Ejemplo 2. Realizar una prueba de bondad de ajuste para verificar si la distribucin dada a continuacin se aproxima a una distribucin normal. Los datos se refieren a las alturas de 100 estudiantes de sexo femenino. Utilice
Altura en Nmero de cm estudiantes 150 - 156 4 156 - 162 12 162 - 168 22 168 - 174 40 174 - 180 20 180 - 186 2
Ejemplo 3: Seis monedas fueron lanzadas 1400 veces. Las frecuencias de los nmeros de caras son dados a continuacin. Verifique si los datos se ajustan a un modelo binomial. Utilice
0 38
1 144
2 342
3 350
4 320
5 160
6 46
El nmero de defectos por unidad observada en una muestra de 100 radios arroj la siguiente distribucin de frecuencia:
Verificar si la distribucin de estos datos se aproxima a una distribucin Poisson, use PRUEBA DE KOLMOGOROV SMIRNOV Recurdese que para aplicar la prueba de bondad de ajuste chi cuadrado cuando el modelo propuesto bajo la hiptesis nula es continuo, es necesario aproximar la forma de la distribucin mediante el agrupamiento de los datos observados en un nmero finito de intervalos de clase. Este requisito de agrupar los datos implica tener una muestra de tamao ms o menos grande. De esta manera la prueba de bondad de ajuste chi cuadrado se encuentra limitada cuando la variable es continua y la muestra aleatoria disponible tiene un tamao pequeo. Una prueba de bondad de ajuste ms apropiada que la chi cuadrado cuando la variable es continua, es la basada en el estadstico Kolmogorov Smirnov. La prueba no necesita que los datos se encuentren agrupados y es aplicable a muestras de tamao grande. Cuando la prueba Kolmogorov Smirnov se aplica para contrastar la hiptesis de normalidad de la poblacin, el estadstico de prueba es la mxima diferencia:
|
Siendo la funcin de distribucin muestral y
|
la funcin terica o correspondiente
a la poblacin normal especificada en la hiptesis nula. La distribucin del estadstico de Kolmogorov-Smirnov es independiente de la distribucin poblacional especificada en la hiptesis nula y los valores crticos de este estadstico estn tabulados. Si la distribucin postulada es la normal y se estiman sus parmetros, los valores crticos se obtienen aplicando la correccin de significacin propuesta por Lilliefors. PRUEBA DE SHAPIRO WILKS
Se rechazar la hiptesis nula de normalidad si el estadstico W es menor que el valor crtico proporcionado por la tabla elaborada por los autores para el tamao muestral y el nivel de significacin dado.
Donde D es la suma de las diferencias corregidas.
PRUEBA DE INDEPENDENCIA: Cuando se quiere verificar la hiptesis nula de que dos variables de clasificacin cuando se aplican a un mismo conjunto de entes, estas variables son independientes.
Ejemplo
Supngase que se desea determinar si las opiniones de los residentes del Distrito de Miraflores respecto a una nueva reforma tributaria son independientes de su nivel de ingreso. Una muestra aleatoria de 1000 residentes registrados del distrito de Miraflores se clasifica de acuerdo con sus ingresos como bajo. medio y alto si estn a favor o en contra de la nueva reforma tributaria. Las frecuencias observadas (resultado de la encuesta) se presentan en la siguiente tabla, la cual se conoce como tabla de contingencia Reforma tributaria Bajo A favor Nivel de Ingresos Total Medio Alto 585 415 1000
En contra 100 (126.6) 140 (141.1) 175 (147.3) Total 305 340 355
a)
Hiptesis a contrastar:
H0: no existe relacin entre el nivel de ingresos y la opinin sobre la reforma tributaria. (independencia entre las dos variables)
b)
Estadstica de contraste
(O i E i ) 2 Ei i
2
c)
d)
e)
Decisin: Se rechaza H0 Conclusin: Se concluye que la opinin de un votante referente a la nueva reforma fiscal y su nivel de ingresos estn relacionados.
f)
Utilice un nivel de significancia de 0.025 para determinar si la proporcin de artculos defectuosos es la misma para los tres turnos.
a)
Hiptesis a contrastar:
b)
Estadstica de contraste:
2
i
(O i E i ) 2 Ei
c)
d)
e)
Decisin: No se rechaza H0 Conclusin: No hay evidencia suficiente como para concluir de que la proporcin de artculos defectuosos producidos en los tres turnos es diferente.
f)
Una empresa grande est interesada en determinar si existe asociacin entre el tiempo de traslado de sus empleados y el nivel de problemas relacionados con el estrs que se observa en el trabajo. Un estudio de 116 trabajadores de la lnea de ensamble revela lo siguiente:
Estrs Tiempo de traslado Menos de 15 minutos De 15 a 45 minutos Ms de 45 minutos Total Elevado 9 17 18 44 Moderado 5 8 6 19 Bajo 18 28 7 53 Total 32 53 31 116