Tema 12
Tema 12
Tema 12
Estadística I
Prof. Andrés Sandoval H
Estadística no paramétrica
1. INTRODUCCIÓN
Suponga que 200 maestros, 300 ingenieros y 400 médicos, participan en un estudio para
calcular la magnitud del
Consumo Maestros Ingenieros Médicos Total consumo de alcohol en
las tres Ocasional 100 50 100 250 profesiones. Los conteos
de Moderado 50 150 200 400 frecuencia se anotan en
una Alto 50 100 100 250 tabla de contingencia
similar Total 200 300 400 900 a la siguiente:
Suponga que al estudiar a 200 maestros, 300 ingenieros y 400 médicos, los resultados
obtenidos son los siguientes:
oi
2
i 1 f ei
esperadas, se parece a los cálculos de la prueba de independencia. Específicamente, el
valor de basados en las frecuencias observadas y esperadas se calcula como sigue:
2
1. Establecer la hipótesis
k f f ei 2
oi
2
i 1 f ei
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
g,l = k- m – 1 = (3 – 0- 1) =
5.99
oi
2
i 1 f ei
Para poder calcular las frecuencias esperadas tenemos que calcular las
probabilidades utilizaremos la formula de la binomial
f ( x ) nx x (1 ) n x
donde n = 10 = 0.05
f (0) 10
0 0.05 ( 1 0.05)
0 10 0
= .599
5. Como 8.26 es mayor que 5.99,se rechaza la hipótesis nula con un nivel de
significancia de 0.05.
6. Conclusión
Se concluye que el porcentaje verdadero de neumáticos con defecto no es el 5%.
Ilustraremos esta técnica con el estudio que realizó Cervecería Modelo, la cual fabrica y
distribuye tres tipos de cerveza: ligera, clara y oscura. En un análisis de segmentación de
mercado para las tres cervezas, el grupo de investigación encargado ha planteado la
duda de si la preferencia para las tres cervezas es diferente entre los consumidores
hombres y mujeres. Si la preferencia de las cervezas fuera independiente del género del
consumidor, se iniciaría una campaña de publicidad para todas las cervezas Modelo. Sin
embargo, si la preferencia depende del género del consumidor, se ajustarían las
promociones para tener en cuenta los distintos mercados meta.
Una prueba de independencia usa la pregunta de si la preferencia de la cerveza (ligera,
clara y oscura) es independiente del genero del consumidor (hombre, mujer). Las
hipótesis para esta prueba de independencia son:
Podemos usar una tabla como la 1 para describir el caso que se estudia. Después de
identificar a la población, consumidores hombres y mujeres, se puede tomar una muestra
y preguntar a cada persona que diga su preferencia entre las cervezas modelo.
Cada persona de la muestra se clasificará en una de las seis celdas de la tabla. Por
ejemplo una persona puede ser hombre y prefiera la cerveza clara [celda (1,2)], una mujer
que prefiere la cerveza ligera [celda (2,1)], una mujer que prefiere la cerveza oscura
[celda (2,3)] y así sucesivamente. Como en la lista aparecen todas las combinaciones
posibles de predilección de cerveza y género, en otras palabras aparecen todas las
contingencias posibles, a la tabla se le llama tabla de contingencia.
Universidad Panamericana
Estadística I
Prof. Andrés Sandoval H
Cerveza preferida
Ligera Clara Oscura
Género Hombre Celda (1,1) Celda (1,2) Celda (1,3)
Supongamos que Mujer Celda (2,1) Celda (2,2) Celda (2,3) se ha
tomado una muestra
aleatoria simple de 150 bebedores de cerveza. Después de saborear cada una, se les
pide expresar su preferencia o primera alternativa. La tabulación cruzada de la siguiente
tabla 2 resume las respuestas obtenidas. Observamos que, los datos para la prueba de
independencia se agrupan en términos de cantidades o frecuencias para cada celda o
categoría. De las 150 personas de la muestra, 20 fueron hombres que prefirieron la
cerveza ligera, 40 fueron mujeres que prefirieron la cerveza clara, 20 fueron hombres que
prefirieron la cerveza oscura, y así sucesivamente.
Los datos de la tabla 2 constituyen las frecuencias observadas para las seis clases o
categorías.
Cerveza preferida
Ligera Clara Oscura Total
Género Hombre 20 40 20 80
Mujer 30 30 10 70
Total 50 70 30 150
Cerveza preferida
Ligera Clara Oscura Total eij
Sea la frecuencia esperada
en la Género Hombre 26.67 37.33 16.00 categoría del renglón i y la
80
Mujer 23.33 32.67 14.00 columna j de la tabla de
70
Total 50.00 70.00 30.00 contingencia.
150 Con esta
notación reconsideremos el
cálculo de la frecuencia esperada para los hombres (renglón i = 1) que prefieren la
e
cerveza clara (columna j = 2) esto es, la frecuencia esperada 1, 2 . Apegándonos al
esquema anterior para el cálculo de las frecuencias esperadas, podemos demostrar que
e1, 2
= (7/15) 80 = 37.33
Esta ecuación se puede escribir como sigue
e1, 2
= (7/15) 80 = (70/150) 80 = 37.33
Observe que 80 es la cantidad total de hombres (total del renglón 1), 70 es la cantidad
total de individuos (hombres y mujeres) que prefieren la cerveza clara (total de la columna
2) y 150 es el tamaño de la muestra total. En consecuencia vemos
k f f ei 2
oi
2
i 1 f ei
Supuestos: