Ejercicios Estadistica Warpole
Ejercicios Estadistica Warpole
Ejercicios Estadistica Warpole
Datos:
Variable aleatoria X: cantidad de bebida que sirve una máquina (en mililitros).
Tamaño de la muestra n = 40 bebidas.
Desviación estándar poblacional σx = 15 mililitros.
Media poblacional μx = 240 mililitros.
Media muestral x = μ x = 240 mililitros.
σ
Desviación estándar muestral σ x x ≃2.3717 mililitros.
n
Incógnita:
μ x 2σ x x μ x 2σ x
Solución:
Respuesta:
Esta fue una decisión razonable puesto que 236 ml., que es la media encontrada se encuentra dentro del
intervalo definido.
Datos:
Variable aleatoria X: vida útil de una máquina de hacer pasta (en años).
Media poblacional μx = 7 años.
Desviación estándar poblacional σx = 1 año.
Tamaño de la muestra n = 9 máquinas.
X ~ N μ x , σ x μ x μ x 7 (años)
1 1
σx x (años)
n 9 3
a) Incógnita:
P(6.4 ≤ x ≤ 7.2)
Solución:
6.4 7 X μx 7.2 7
P P 1.8 z 0.6 P z 0.6 P z 1.8
13 σx 1
3
n
Aplicando Tabla A.3. = 0.7257 – 0.0359 = 0.6898 = 68.98%.
Respuesta:
La probabilidad de que la vida media de una muestra de 9 de esas máquinas caiga entre 6.4 años y 7.2 años es
del 68.98%.
b) Incógnita:
Un valor de x que deje a su derecha un área del 15% y por lo tanto un área del 85% a su izquierda.
Solución:
_
x7 1 _
Z Z 0.85 1.04 Z 0.85 1.04 * 7 x 7.346667 Años
1 3
3
x = 7.35 años
Respuesta:
El valor de x que deja a su derecha un área del 15% es 7.35 años.
El tiempo que el cajero de un banco con servicio en el automóvil atiende a un cliente es una variable
aleatoria con media μ = 3.2 minutos y una desviación estándar σ = 1.6 minutos. Si se observa una
muestra aleatoria de 64 clientes, encuentre la probabilidad de que su tiempo medio con el cajero sea:
a) a lo más 2.7 minutos;
b) más de 3.5 minutos;
c) al menos 3.2 minutos pero menos de 3.4 minutos.
Datos:
X ~ N μ x , σ x μ x μ x 3.2 (años)
x 1.6 1.6
σx (años) a) Incógnita:
n 64 8 P( x ≤ 2.7)
Solución:
X μx 2.7 3.2
P P z 2.5 = Aplicando Tabla A.3. = 0.0062 = 0.62%
σx 1.6
8
n
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea a lo más 2.7 minutos es de 0.62%.
b) Incógnita:
P( x > 3.5)
Solución:
X μx 3.5 3.2
P P z 1.5 1 P z .5 1 0.9332 = Aplicando Tabla A.3. = 0.0668 =
σx 1.6
n 64
6.68%.
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero sea más 3.5 minutos es de 6.68%.
c) Incógnita:
P(3.2 ≤ x ≤ 3.4)
Solución:
3.2 3.2 X μx 3.4 3.2
P P 0 z 1 P z 1 P z 0
1.6 σx 1.6
64 n 64
Aplicando Tabla A.3 = 0.8413 – 0.5000 = 0.3413 = 34.13%.
Respuesta:
La probabilidad de que el tiempo promedio de los cliente con el cajero este entre 3.2 y 3.4 minutos es de
34.13%.
Problema 4 (Ref: Pág. 224 - Ej. 12)
Se toma una muestra aleatoria de tamaño 25 de una población normal que tiene una media de 80 y una
desviación estándar de 5. Una segunda muestra aleatoria de tamaño 36 se toma de una población
normal diferente que tiene una media de 75 y una desviación estándar de 3. Encuentre la probabilidad
de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada de las 36
mediciones por al menos 3.4 pero en menos de 5.9. Suponga que las medias se miden al décimo más
cercano.
Datos:
Incógnita:
P 3.4 X1 X 2 5.9
Solución:
σ12 σ 22
μ x1 - x 1 μ 1 μ 2 y σ 2x1 - x 2 .
n1 n 2
De aquí
Z
X X μ
1 2 1 μ2
σ n σ
2
1 1
2
2 n2
P(z 0.8050) P z 1.4311 Aplicando Tabla A.3. = 0.7896 – 0.0762 = 0.7134 = 71.34%.
Respuesta:
La probabilidad de que la media muestral calculada de las 25 mediciones exceda de media muestral calculada
de las 36 mediciones por al menos 3.4 pero en menos de 5.9 es de 71.34%.
2
a) Según Tabla A.5 χ 0.025 cuando υ = 15 => 27.488
Respuesta:
El valor χ2 con 15 grados de libertad, que deja un área de 0.025 a su derecha es 27.488.
Gráfica:
2
b) Según Tabla A.5 χ 0.01 cuando υ = 7 => 18.475
Respuesta:
El valor χ2 con 7 grados de libertad, que deja un área de 0.01 a su derecha es 18.475.
Gráfica:
2
c) Según Tabla A.5 χ 0.05 cuando υ = 24 => 36.415
Respuesta:
El valor χ2 con 24 grados de libertad, que deja un área de 0.05 a su derecha es 36.415.
Gráfica:
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.99 es decir 99 %, con 4 grados de libertad es
0.297.
Respuesta:
El valor de χ2 que deja a su derecha una probabilidad igual a 0.025 es decir 2.5 %, con 19 grados de libertad
es 32.852.
Gráfica:
Respuesta:
El valor de χ2 debe ser igual a 46.928 para que la probabilidad entre 37.652 y dicho valor calculado sea igual a
0.045, es decir 4.5%, con 25 grados de libertad.
Gráfica:
Datos:
a) Incógnita:
P (s2 > 9.1)
Solución:
χ2
n 1 s 2 con (n – 1) grados de libertad
σ2
Respuesta:
La probabilidad de que la varianza de esa muestra sea mayor que 9.1 es del 5%.
b) Incógnita:
P (3.462 ≤ s2 ≤ 10.745)
Solución:
χ2
n 1 s 2 con (n – 1) grados de libertad
σ2
χ2
25 1 10.745 24 10.745 257.88 42.98
6 6 6
Según Tabla A.5 χ 2
42.98 cuando υ = 24 =>0.01
Respuesta:
La probabilidad de que la varianza de esa muestra se encuentre entre 3.462 y 10.745 es del 94%.
Datos:
P: estudiantes de primer año de licenciatura.
X ~ N μ x 74, σ x 8
Incógnita:
Considerar si es válida σ 2x = 8
Solución:
χ2
n 1 s 2 con (n – 1) grados de libertad
σ2
χ2
20 1 20 19 20 380 47.5
8 8 8
2 2
χ 0..975 8.907 χ 0.025 32.852
Respuesta:
Es un valor de una distribución ji cuadrada con 19 grados de libertad.
Como 95% de los valores χ2 con 19 grados de libertad caen entre 8.907 y 32.852, el valor calculado con σ 2 = 8
no es razonable y por lo tanto se tiene razón suficiente para sospechar que la varianza es diferente a ocho.
Es muy probable que el valor supuesto de σ2 sea un error.
Respuesta:
El valor t con 14 grados de libertad, que deja un área de 0.025 a su derecha es 2.145.
Gráfica:
Respuesta:
El valor t con 10 grados de libertad, que deja un área de 0.10 a su izquierda es -1.372.
Gráfica:
Respuesta:
El valor t con 7 grados de libertad, que deja un área de 0.995 a su derecha y por lo tanto un área de 0.005 a su
izquierda es -3.499.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea menor que 2.365 con 7 grados de libertad es del 97.5%.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea mayor que 1.318 con 24 grados de libertad es del 10%.
Gráfica:
Respuesta:
La probabilidad de que un valor t se encuentre entre -1.356 y 2.179 con 12 grados de libertad es del 87.5%.
Gráfica:
Respuesta:
La probabilidad de que un valor t sea mayor que -2.567 con 17 grados de libertad es del 99%.
Gráfica:
Datos:
Solución:
De la tabla A.4 encontramos que t0.025 = 2.131 para 15 grados de libertad. Por tanto, la empresa queda
satisfecha con esta afirmación si una muestra de 16 baterías rinde un valor t entre –2.131 y 2.131. si μ = 30,
entonces
X μ
T con (n – 1) grados de libertad
s
n
27.5 30
T 2 ,
5 16
Respuesta:
La empresa estaría satisfecha con su afirmación ya que el valor hallado de t pertenece al intervalo establecido
como parámetro para poder afirmar que sus baterías promedian las 30 horas de duración.
Datos:
Solución:
X μ
T con (n – 1) grados de libertad
s
n
= 1 – P (│ X - 20│ ≤ 4) =
= 1 – P (-4 ≤ X - 20 ≤ 4) =
4 4
=1–P X 20 =
4.1 4.1
3 3
= 1 – P (-2.92 ≤ t8 ≤ 2.92) =
Respuesta:
Si se tiene la posibilidad de obtener una muestra de tamaño 9 con esas condiciones, con una probabilidad del
1.918%
Datos:
Media muestral X
i 1
i
0.6 0.7 0.7 0.3 0.4 0.5 0.4 0.2 3.8
0.475 gramos
x 8 8
n
n
X X
2
i
Desviación estándar muestral i 1
s
n 1
s
0.6 0.475 2 (0.7 0.475)2 (0.7 0.475)2 (0.3 0.475)2 (0.4 0.475)2 (0.5 0.475)2 (0.4 0.475)2 (0.2 0.475
7
0.125 2 0.225 2 0.225 2 0.175 2 0.075 2 0.025 2 0.075 2 0.275 2
0.26
0.037 0.18
7 7
Incógnita:
μx = 0.5
Solución:
X μ
T con (n – 1) grados de libertad
s
n
X μ X μ0
P
s s
n n
con nuestros datos
Respuesta:
Hay razones suficiente (75,08%) para considerar que la afirmación es cierta.
Respuesta:
El valor f con 7 y 15 grados de libertad, que deja un área de 0.05 a su derecha es 2.71.
Gráfica:
Respuesta:
El valor f con 15 y 7 grados de libertad, que deja un área de 0.05 a su derecha es 3.51.
Gráfica:
Respuesta:
El valor f con 24 y 19 grados de libertad, que deja un área de 0.01 a su derecha es 2.92.
Gráfica:
d) ƒ0.95 con υ1 = 19 y υ2 = 24
1
f 1α υ1, υ2
f α υ 2 , υ1
1 1
f 0.95 19,24 = 0.4739
f 0.05 24,19 2.11
Respuesta:
El valor f con 19 y 24 grados de libertad, que deja un área de 0.95 a su derecha es 0.4739.
Gráfica:
e) ƒ0.99 con υ1 = 28 y υ2 = 12
1
f 1α υ1, υ2
f α υ 2 , υ1
1 1
f 0.99 28,12 = 0.3448
f 0.01 12,28 2.90
Respuesta:
El valor f con 28 y 12 grados de libertad, que deja un área de 0.99 a su derecha es 0.3448.
Gráfica:
Datos:
Media muestral X
i 1
i
x
n
163000 148000 152000 135000 141000 739000
147800 $
5 5
Incógnita:
Varianza muestral s2
Solución:
X 2
i X
i 1
s2
n 1
con nuestros datos
s 2
163000 147800 148000 147800 152000 147800 135000 147800 141000 147800
2 2 2 2 2
4
15200 200 4200 12800 6800
2 2 2 2 2
458800000
114700000 $
4 4
Respuesta:
La varianza de este conjunto es 114700000 $.
Incógnita:
P S12 S 22 1.26
Solución:
s12 σ 22 s12 σ 22
F
σ12 s 22 s 22 σ12
Respuesta:
La probabilidad de que F con 24 y 30 grados de libertad sea mayor que 1.26 es de 0.05, es decir, 5%.
Datos:
X ~ N μ x 780, σ x 40
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 96% de confianza.
Solución:
σ σ
X z 1α 2 μ X z 1α 2
n n
100γ% =100(1-α)% = 96% =>α = 0.04 => z1 2 => z0.98 = 2.054
40 40
780 2.054 μ x 780 2.054
30 30
765 hs. μ x 795 hs.
Respuesta:
Podemos afirmar con un nivel de confianza del 96% que la media poblacional se encuentra entre 765 y 795
horas.
Datos:
n
2
z 1 α 2 σ
n
e
n
2
2.054.40
n 67.5 n 68
10
Respuesta:
Por lo tanto, podemos tener una confianza 96% de que una muestra aleatoria de tamaño 68 proporcionara una
estimación x que difiere de μ por una cantidad menor que 0.04.
Datos:
P: estudiantes universitarios.
Variable aleatoria X: medidas de esos estudiantes universitarios (en centímetros)
Tamaño de la muestra n = 50 estudiantes.
Media muestral x = 174.5 centímetros.
Desviación estándar muestral s = 6.9 centímetros.
a) Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 98% de confianza.
Solución:
s s
X tα 2 μ X tα 2
n n
6.9 6.9
174.5 2.4048 174.5 2.4048
50 50
172.15 cm. μ 176.85 cm.
Respuesta:
Podemos afirmar con 98% de confianza que la media poblacional se encuentra entre 172.15 y 176.85
centímetros.
b) Incógnita:
Posible error de estimación.
Solución:
Respuesta:
Podemos afirmar con 98% de confianza que el error de estimación es igual a 2.35 cm.
Datos:
Media muestral X
i 1
i
1.01 0.97 1.03 1.04 0.99 0.98 0.99 1.01 1.03
1.0055
x 9
n
cm.
n
X X
2
i
Desviación estándar muestral i 1
s
n 1
s
1.01 1.0055 2 (0.97 1.0055) 2 (1.03 1.0055) 2 (1.04 1.0055) 2 (0.99 1.0055) 2 (0.98 1.0055) 2 (0
8
Incógnita:
Intervalo de confianza para la media poblacional, μ x, con 99% de confianza.
Solución:
s s
X tα 2 μ X tα 2
n n
0.0245 0.0245
1.0055 3.355 μ 1.0055 3.355
9 9
0.9781 cm. μ 1.0329 cm.
Respuesta:
Podemos afirmar con 99% de confianza que la media poblacional se encuentra entre 0.9781 y 1.0329
centímetros.
Datos:
P: botellas de aspirinas.
X: cantidad de aspirina que contienen las botellas de aspirina (en miligramos).
Tamaño de la muestra n = 25 botellas de aspirina.
Media muestral x = 325.05 mg. de aspirina.
Incógnita:
Limites de tolerancia del 95% que contendrán 90% de aspirina.
Solución:
x ± ks
Respuesta:
Los límites de tolerancia del 95% que contendrán 90% de aspirina para esta marca son 323.946 mg y 326.154
mg,
Datos:
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
σ 12 σ 22
μ x1 x 2 μ 1 μ 2 y σ x1 x 2
n1 n 2
σ12 σ 22 σ 12 σ 22
x1 x 2 z α . μ1 μ 2 x1 x 2 z α .
2 n1 n 2 2 n1 n 2
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
2.80 y 7.19.
Calcule un intervalo de confianza de 95% para μ1 – μ2,suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra n1 = 12 neumáticos.
Tamaño de la segunda muestra n2 = 12 neumáticos.
Media de la primer muestra x 1 = 36300 Km.
Media de la segunda muestra x 2 = 38100 Km.
Desviación estándar de la primer muestra s 1 = 5000 Km.
Desviación estándar de la segunda muestra s 2 = 6100 Km.
Solución:
s12 s 22 s12 s 22
x1 x 2 t α μ1 μ 2 x1 x 2 t α donde t α es el valor t con
2 n1 n 2 2 n1 n2 2
υ
s12
n1 s 2
2 n2
2
25000000 12 37210000 12 2 2083333.3 3100833.3 2 21.18
s12 n1
2
s22 n2
2
25000000 12 2 37210000 12 2 2083333.3 2 3100833.3 2
12 1 12 1 11 11
n1 1 n2 1
Medicamento 1 Medicamento 2
n1 = 14 n 2 = 16
x 1 = 17 x 2 = 19
s 12 = 1.5 s 22 = 1.8
Encuentre un intervalo de confianza de 99% para la diferencia μ 2 – μ1 en el tiempo promedio de
recuperación para los dos medicamentos, suponga poblaciones normales con varianzas iguales.
Datos:
P1 : pacientes que se tratan con el medicamento 1.
X 1 : tiempo de recuperación en días para un paciente tratado con el medicamento 1.
Tamaño de la primer muestra n1 = 14 días.
Primer media muestral x 1 = 17 días.
Primer varianza muestral s 12 = 1.5 días.
Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 2 μ1 , con 99% de confianza.
Solución:
1 1
μ x 2 x1 μ 2 μ 1 y σ x 2 x1
n 2 n1
s 2p
n 1 1 * s12 n 2 1 * s 22
n1 n 2 2
s 2p
14 1 * 1.5 16 1 * 1.8 1.6607 s p 1.2886
14 16 2
luego,
1 1 1 1
x 2 x1 t α sp μ 2 - μ1 x 2 x1 t α s p
2 n 2 n1 2 n 2 n1
Lafata Desio Fernando, Warlet Iván Lautaro Página 38 de 103
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
Respuesta:
Podemos afirmar con 99% de confianza que la diferencia entre las medias ( μ 2 - μ1 ) poblacionales se
encuentra entre 0.70 y 3.30.
Datos:
a) Incógnita:
Intervalo de confianza de 96% para la fracción de la población que favorece el convenio.
Solución:
p̂ * q̂
0.57 * 0.43
0.2451
0,0012255 0.035
n 200 200
p̂ * q̂ p̂ * q̂
p̂ z α * p p̂ z α *
2 n 2 n
Respuesta:
Podemos afirmar con 96% de confianza que la fracción que favorece el convenio se encuentra entre 0.49811
y 0.64189, es decir, 49.81% y 64.19% respectivamente.
b) Incógnita:
Posible error de estimación.
Solución:
Respuesta:
Podemos afirmar con 96% de confianza que le error de estimación no superará el 7.2 %.
Datos:
Sabemos que:
p̂ 0.57
Y que q̂ 0.43
Incógnita:
Solución:
Con
Intervalo de error e = 0.02.
z α2 2 p̂q̂
n
e2
n
2.054 2 0.57 0.43
1.030
2575 votantes
0.02 2 0.0004
Respuesta:
Si basamos nuestra estimación de p sobre una muestra aleatoria de tamaño 2575, podemos tener una
confianza de 96% de que nuestra proporción muestral no diferirá de la proporción real por más de 0.02.
Datos:
P1 : hombres
P2 : mujeres
p1 : proporción de hombres que tienen cierto trastorno sanguíneo menor.
p2 : proporción de mujeres que tienen cierto trastorno sanguíneo menor.
Incógnita:
Intervalo de confianza de 96% para la diferencia de las fracciones de población que favorece el convenio.
Solución:
p̂1 * q̂ 1 p̂ 2 * q̂ 2 p̂ * q̂ p̂ * q̂
p̂ 2 p̂1 z α * p 2 p1 p̂ 2 p̂1 z α * 1 1 2 2
2 n1 n2 2 n1 n2
Respuesta:
Podemos afirmar con 95% de confianza que la diferencia entre la proporción de hombres y mujeres que
padecen el trastorno sanguíneo se encuentra entre – 0.01355 y 0.06355.
Datos:
Tamaño de la muestra n = 20 empleados.
6.74
Proporción de éxitos en 1990 las mujeres constituían 33,7 % de 20 empleados Pˆ1 0.337
20
7.24
Proporción de éxitos en 1994 las mujeres constituían 36,2 % de 20 empleados Pˆ2 0.362
20
Proporción de fracasos de la muestra en 1990 q̂ 1 1 p̂1 1 0.337 0.663
Proporción de fracasos de la muestra en 1994 q̂ 2 1 p̂ 2 1 0.362 0.638
Intervalo de confianza IC = 95%
100γ = 100(1 - α) % = 95% =>α =0.05 => z1 2 => z0.025 1.96 .
a) Incógnita:
Estimar el número que habrían sido mujeres en cada año.
Solución:
En 1990 el 33.7% de 20
n * Pˆ1 20 * 0.337 6.74 7 mujeres
En 1994 el 36.2% de 20
n * Pˆ2 20 * 0.362 7.24 7 mujeres
Respuesta:
Estimamos que en 1990 habría sido de 6.74 7 mujeres, y en 1994 la estimación habría sido de 7.24 7
mujeres.
b) Incógnita:
Intervalo de confianza de 95% para ver si hay evidencia de que la proporción de mujeres contratadas
como personal editorial en 1994 fue mayor que la proporción contratada en 1990.
Solución:
Pˆ Pˆ Z
2 1 /2 *
pˆ 1 * qˆ1 pˆ 2 * qˆ 2
n1
n2
pˆ * qˆ
n1
pˆ * qˆ
p 2 p1 Pˆ2 Pˆ1 Z / 2 * 1 1 2 2
n2
Datos:
P: baterías de automóvil.
X: tiempo de duración en años de una batería.
Media poblacional μx = 3 años.
Desviación estándar poblacional σx = 1 año. X ~ N μ x 3, σ x 1
Intervalo de varianza IC = 95%.
Incógnita:
σ2 = 1 año 2
Solución:
Se desea estimar el valor de la varianza utilizando S 2 como estimador.
2
n
n
n x x i 2
i
s 2 i 1 i 1
n n 1
s2
5 * 48.26 15 2
241.3 225
0.815 año 2
5 4 20
S 0.902774 años
n 1s 2 σ 2 n 1s 2
χ α2 χ 12α
2 2
Respuesta:
Podemos afirmar con 95% de confianza que, ya que este intervalo 0.292639 2 6.735537 contiene a 1,
que la afirmación del fabricante, de que σ2 = 1, es válida.
a) Calcule un intervalo de confianza de 95% para μ1 – μ2, suponga que las poblaciones se distribuyen de
forma aproximadamente normal. Puede no suponer que las varianzas son iguales.
Datos:
P1 : neumáticos de la marca A.
P2 : neumáticos de la marca B.
X1 : duración en kilómetros de un neumático de la marca A.
X2 : duración en kilómetros de un neumáticos de la marca B.
Tamaño de la primer muestra n1 = 12 neumáticos.
Tamaño de la segunda muestra n2 = 12 neumáticos.
Media de la primer muestra x 1 = 36300 Km.
Media de la segunda muestra x 2 = 38100 Km.
Desviación estándar de la primer muestra s 1 = 5000 Km.
Desviación estándar de la segunda muestra s 2 = 6100 Km.
a) Incógnita:
Intervalo de confianza para la diferencia de las medias poblacionales, μ 1 – μ2, con 95% de confianza.
Solución:
s12 s 22 s12 s 22
x1 x 2 t α μ1 μ 2 x1 x 2 t α donde t α es el valor t con
2 n1 n 2 2 n1 n2 2
υ
s12
n1 s 2
2 n2
2
s12 n1
2
s22
n2
2
n1 1 n2 1
6533.4 1 2 2933.4
Respuesta:
Podemos afirmar con un 95% de confianza que la diferencia entre las medias poblacionales se encuentra entre
–6533.4 y 2933.4.
b) Incógnita:
Intervalo de confianza de 90% para σ 21/ σ22.
Solución:
2
25000000 1 σ1 25000000
2
2.80
37210000 2.80 σ 2 37210000
12
0.238249 2 1.894652
2
Respuesta:
Podemos afirmar con 90% de confianza que σ 12 σ 22 se encuentra entre 0.238249 y 1.894652, ya que el
intervalo contiene a 1 es razonable asumir que σ21 = σ22.
Solución:
En símbolos:
H 0 ) p 0.30
H 1 ) p 0.30
a) Cuando concluye que al menos de 30% del público es alérgico a algunos productos de queso cuando, de
hecho, el 30% o más son alérgicos.
b) Cuando concluye que al menos el 30% del público es alérgico a algunos productos de queso cuando, de
hecho, menos del 30% son alérgicos.
Datos:
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios p = 0.6 graduados universitarios.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 6.09%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios p = 0.5 graduados universitarios.
i 12
β = P(error tipo II) =P(6 ≤ x ≤ 12 | p = 0.5) = b( x;15;0.5) = Aplicando Tabla A.1 = 0.8464 =
i 6
84.64%.
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
El procedimiento empleado para este ejercicio no es un buen procedimiento de prueba ya que la probabilidad
es muy alta.
Problema 33 (Ref: Pág. 304 – Ej. 5)
Repita el ejercicio 4 cuando se seleccionan 200 adultos y la región de aceptación se define como 110 ≤
x ≤ 130 donde x es el número de graduados universitarios en nuestra muestra. Utilice la
aproximación normal.
Datos:
Tamaño de la muestra n = 200 adultos.
Región de aceptación 110 ≤ x ≤ 130 graduados universitarios.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de adultos graduados universitarios p = 0.6 graduados universitarios.
y
Z
α = P(error tipo I) = P(110 > x > 130 | p = 0.6) = P( x < 110 | p = 0.6) + P( x > 130 | p = 0.6) =
= P(z < -1.52) + P(z < 1.52) = (2)*(0.0643) = 0.1286 = 12.86%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 12.86%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
y
Z
β = P(error tipo II) =P(110 < x < 130 | p = 0.5) =P(1.34 < z < 4.31) = P(z ≤ 4.31) – P(z ≤ 1.34) =
= 1 – 0.9099 = 0.0901 = 9.01%.
y
Z
β = P(error tipo II) =P(110 < x < 130 | p = 0.7) = P(-4.71< z < -1.47) = P(z ≤ -1.47) – P(z ≤ -4.71) =
= 0.0708 – 0 = 0.0708 = 7.08%.
Respuesta:
c) Incógnita:
Es este un buen procedimiento de prueba?
Solución:
Para este procedimiento la probabilidad de cometer un error Tipo I es algo alto, aunque se reduce
dramáticamente la probabilidad de cometer un error Tipo II.
Datos:
P : votantes de una cierta ciudad.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto.
y
Z
α = P(error tipo I) = P(221 > x > 259 | p = 0.6) = P( x < 221 | p = 0.6) + P( x > 259 | p = 0.6) =
=P(z < -1.99) + P(z < 1.99) = (2)*(0.0233) = 0.0466 = 4.66%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 4.66%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
y
Z
β = P(error tipo II) =P(221 < x < 259 | p = 0.48) = P(2.85< z < 6.75) = P(z ≤ 6.75) – P(z ≤ 2.85) =
=1 – 0.9978 = 0.0022 = 0.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 0.22%.
Datos:
Tamaño de la muestra n = 400 votantes.
Región de aceptación 214 < x < 266 → 215 ≤ x ≤ 265 votantes que favorecen el impuesto.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Proporción de votantes a favor del impuesto p = 0.6 votantes a favor del impuesto.
Media μ = n*p = (400)*(0.6) = 240.
Desviación estándar σ = n * p * q 400 * 0.6 * 0.4 9.79
Necesitamos conocer el área bajo la curva normal entre
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
α = P(error tipo I) = P(214 > x > 266, cuando p = 0.6) = (2)*P(z < -2.60) = (2)*(0.0047) = 0.0094 = 0.94%.
Respuesta:
La probabilidad de cometer un error tipo I con p = 0.6 es del 0.94%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Proporción de adultos graduados universitarios p = 0.48 graduados universitarios.
Media μ = n*p = (400)*(0.48) = 192.
Desviación estándar σ = n * p * q 400 * 0.48 * 0.52 9.99
Necesitamos conocer el área bajo la curva normal entre 214.5 y 265.5
215 ≤ x ≤ 265 → 215 - 0.5 ≤ y ≤ 265 + 0.5 → 214.5 ≤ y ≤ 265.5
β = P(error tipo II) =P(214 < x < 266, cuando p = 0.48) =P(2.25≤ z ≤ 7.35) = P(z ≤ 7.35) – P(z ≤ 2.25) =
= 1 – 0.9878 = 0.0122 = 1.22%.
Respuesta:
La probabilidad de cometer un error tipo II con p = 0.48 es del 1.22%.
Problema 36 (Ref: Pág. 305 – Ej. 15)
Una máquina de refrescos en un restaurante de carnes asadas se ajusta de modo que la cantidad de
bebida que sirva esté distribuida de forma aproximadamente normal con una media de 200 mililitros y
una desviación estándar de 15 mililitros. La máquina se verifica periódicamente con una muestra de
nueve bebidas y con el cálculo del contenido promedio. Si x cae en el intervalo 191 < x < 209, se
considera que la máquina opera de manera satisfactoria: de otro modo, concluimos que μ ≠ 200
mililitros.
a) Encuentre la probabilidad de cometer un error tipo I cuando μ = 200 mililitros.
b) Encuentre la probabilidad de cometer un error tipo II cuando μ = 215 mililitros.
Datos:
P : bebida que sirve cierta maquina de refresco.
X : medida en mililitros de esa maquina de refresco.
a) Incógnita:
Probabilidad de error tipo I, α
Solución:
Media μ = 200 mililitros. X ~ N μ x 200, σ x 15
Necesitamos conocer el área bajo la curva normal entre 191 y 209
α = P(error tipo I) = P(191 > x > 209) = (2)*P(z < -1.80) = (2)*(0.0359) = 0.0718 = 7.18%.
Respuesta:
La probabilidad de cometer un error tipo I con es del 7.18%.
b) Incógnita:
Probabilidad de error tipo II, β
Solución:
Media μ = 215 mililitros. X ~ N μ x 200, σ x 15
Necesitamos conocer el área bajo la curva normal entre 191 y 209
β = P(error tipo II) =P(191 < x < 209) =P(-4.80 ≤ z ≤ -1.20) = P(z ≤ -1.20) – P(z ≤ -4.80) =
= 0.1151 – 0 = 0.1151 = 11.51%.
Respuesta:
La probabilidad de cometer un error tipo II es del 11.51%.
Datos:
P : focos fabricados en cierta empresa eléctrica.
X : duración en horas de un foco fabricado en esa empresa eléctrica.
Tamaño de la muestra n = 30 focos.
Desviación estándar poblacional σ = 40 horas.
Media muestral x = 788 horas.
σx 40
Desviación estándar muestral σx 7.30 mililitros.
n 30
Nivel de significancia α = 0.04
X ~ N μ x 788, σ x 40
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
X μ
z
σ
n
788 800
z =-1.64
7.30
Si z α z z α , no se rechaza H0.
2 2
z 0.04 z z 0.04
2 2
z 0.02 z z 0.02 Aplicando Tabla A.3.
Respuesta:
No rechazamos la hipótesis nula ya que el valor de z hallado se encuentra dentro de la región de no rechazo.
Datos:
Incógnita:
Rechazo o aceptación de la hipótesis nula.
Solución:
Es conveniente estandarizar X e incluir de manera formal la variable aleatoria normal estándar Z, donde
X μ
z
σ
n
23500 20000
z = 8.97.
3900 / 100
Respuesta:
Datos:
P : envases de un lubricante.
X : contenido en litros de un envase de ese lubricante.
Tamaño de la muestra n = 10 envases.
n
Media muestral X
i 1
i
x
n
10.2 9.7 10.1 10.3 10.1 9.8 9.9 10.4 10.3 9.8
10.06 litros.
10
n
X X
2
i
Desviación estándar muestral i 1
s
n 1
s
10.2 10.06 2 (9.7 10.06)2 (10.1 10.06)2 (10.3 10.06)2 (10.1 10.06) 2 (9.8 10.06)2 (9.9 10.06
9
0.14 2 0.36 2 0.04 2 0.24 2 0.04 2 0.26 2 0.16 2 0.34 2 0.24 2 0.26 2
9
Nivel de significancia α = 0.01
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
10.06 10
X μ t 0.7722 .
t 0.0777
s
n
Si t α , n 1
t tα , n 1 , no se rechaza H0.
2 2
t 0.01 ,9
t t 0.01 ,9
2 2
t 0.005,9 t t 0.005,9 Aplicando Tabla A.4.
- 3.250 < t < 3.250
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región de No Rechazo.
b) Ref. Pág. 339 – Ej.1
Datos:
Media muestral X
i 1
i
10.2 9.7 10.1 10.3 10.1 9.8 9.9 10.4 10.3 9.8
10.06
x 10
n
litros.
n
X X
2
i
Desviación estándar muestral i 1
s
n 1
10.2 10.06 2 (9.7 10.06)2 (10.1 10.06)2 (10.3 10.06)2 (10.1 10.06)2 (9.8 10.06)2 (9.9 10.06
s
9
0.14 2 0.36 2 0.04 2 0.24 2 0.04 2 0.26 2 0.16 2 0.34 2 0.24 2 0.26 2
9
Nivel de significancia α = 0.01
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
n 1 * s 2
x2
σ2
Según Tabla A.5 => 0.025 < P(χ2 >18.13) < 0.05
Respuesta:
No rechazamos la hipótesis nula ya que la muestra de 10 envases no es suficiente para mostrar que σ2 no es
igual a 0.03.
Datos:
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
z
X 1 X 2 μ1 μ 2
σ12 σ 22
n1 n 2
z
81 76 0
5
4.222
27.04 11 .56 1.184
25 36
Respuesta:
Rechazamos la hipótesis nula ya que la probabilidad de que ocurra es aproximadamente del 0%.
Prueba la hipótesis de que no hay diferencias en las dos marcas de llantas con un nivel de significancia
de 0.05. Suponga que las poblaciones se distribuyen de forma aproximadamente normal con varianzas
iguales.
Datos:
Tamaño de la primer muestra n1 = 12 llantas.
Tamaño de la segunda muestra n2 = 12 llantas.
Desviación estándar de la primer muestra s1= 5100 Km.
Desviación estándar de la segunda muestra s2 = 5900 Km.
Media de la primer muestra x 1 = 37900 Km.
Media de la segunda muestra x 2 = 39800 Km.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
sp
s * n 1 s * n 1
2
1 1
2
2 2
n1 n2 2
sp
26010000 * 11 34810000 * 11
286110000 382910000
669020000
5514.52Km.
12 12 2 22 22
t
X 1 X 2 μ1 μ 2
1 1
sp
n1 n 2
Con nuestros datos:
t
37900 39800 0
1900
1900
0.84
1 1 5514.52 0.408 2249.92
5514.52
12 12
Si t , n1 n 2 2
t t , n1 n 2 2 , no se rechaza H0.
2 2
t 0.05 ,12 12 2
t t 0.05 ,12 12 2
2 2
t 0.025, 22 t t 0.025, 22 Aplicando Tabla A.4.
2.074 t 2.074
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
Datos:
Tamaño de la primer muestra n1 = 12 llantas.
Tamaño de la segunda muestra n2 = 12 llantas.
Desviación estándar de la primer muestra s1= 5100 Km.
Desviación estándar de la segunda muestra s2 = 5900 Km.
Media de la primer muestra x 1 = 37900 Km.
Media de la segunda muestra x 2 = 39800 Km.
Hipótesis nula H 0: 1 2
Hipótesis alternativa H 1: 1 2
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
1
f 1α υ1, υ2 con v1 n1 1 y v2 n2 1 grados de libertad
f α υ 2 , υ1
1 1
f 0.95 11,11 0.35
f 0.05 11,11 2.82
Gráficamente:
2
La hipótesis nula se rechaza cuando f 2.82 ó f 0.35 , donde f s1 , con v1 11 y v1 11
s 22
grados de libertad.
23010000
y por ello f 0.7472
34810000
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.35, 0.7472 < 0.35.
Pruebe la hipótesis de que el tiempo de duración promedio de las películas producidas por la compañía
2 excede el tiempo promedio de duración de la que produce la compañía 1 en 10 minutos, contra la
alternativa unilateral de que la diferencia es de más de 10 minutos. Utilice un nivel de significancia de
0.1 y suponga que las distribuciones de los tiempos son aproximadamente normales con varianzas
iguales.
Datos:
X1 : tiempo de duración en minutos de una película producida por la compañía 1.
X2 : tiempo de duración en minutos de una película producida por la compañía 2.
Tamaño de la primer muestra n1 = 5 películas.
Tamaño de la segunda muestra n2 = 7 películas.
n
X1 ~ N μ x1 97.4, σ x1 19.86
X 2 ~ N μ x 2 110, σ x 2 79.95
X X
2
i
Desviación estándar de la primer muestra i 1
s1
n1 1
s1
102 97.4 2 (86 97.4) 2 (98 97.4) 2 (109 97.4) 2 (92 97.4) 2
4
X X
n
2
i
Desviación estándar de la segunda muestra
s2 i 1
n2 1
s2
81 110 2 (165 110) 2 (97 110) 2 (134 110)2 (92 110)2 (87 110)2 (114 110) 2
6
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
t
X 2 X1 μ 2 μ1
s 22 s12
n 2 n1 con nuestros datos:
t
110 97.4 10
12.6 10
2.6
2.6
0.22
913.24 78.67 130.46 15.73 146.19 12.09
7 5
Si t α ,υ
t tα ,υ , no se rechaza H0.
2 2
Con
υ
s1 n1 s 2 n2
2 2 2
78.68 5 913.25 7
2
15.74 130.46
2
s1 n1 s2 n2
2 2 2 2
78 .68 5 2
913. 25 7 2
15 . 74 2
130.46 2
n1 1 n2 1 5 1 7 1 4 6
146.2 2
21374.44
21374.44
7.38 υ 7
247.75 17019.81 61.90 2836.75 2898.65
4 6
entonces: t 0.1 ,7
t t 0.1 ,7
2 2
t 0.05, 7 t t 0.05, 7 Aplicando Tabla A.4.
2.998 t 2.998
Respuesta:
No rechazamos la hipótesis nula ya que el valor de t hallado se encuentra dentro de la región crítica.
b) Ref. Pág. 340 – Ej. 10
Datos:
Tamaño de la primer muestra n1 = 5 películas.
Tamaño de la segunda muestra n2 = 7 películas.
X X
2
i
Desviación estándar de la primer muestra i 1
s1
n1 1
s1
102 97.4 2 (86 97.4) 2 (98 97.4) 2 (109 97.4) 2 (92 97.4) 2
4
X X
n
2
i
Desviación estándar de la segunda muestra
s2 i 1
n2 1
s2
81 110 2 (165 110) 2 (97 110) 2 (134 110) 2 (92 110) 2 (87 110) 2 (114 110) 2
6
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Sabemos que:
1
f 1α υ1, υ2 con v1 n1 1 y v2 n2 1 grados de libertad
f α υ 2 , υ1
1 1
f 0.95 4,6 0.16
f 0.05 6,4 6.16
Gráficamente:
2
La hipótesis nula se rechaza cuando f 4.53 ó f 0.16 , donde f s1 , con v1 4 y v1 6 grados
s 22
de libertad.
Respuesta:
Rechazamos la hipótesis nula, para σ12 = σ22 , ya que el valor de f hallado es f < 0.16, 0.09 < 0.16.
En cierta universidad se estima que a lo más 25% de los estudiantes van en bicicleta a la escuela. ¿ Esta
parece ser una estimación valida si, en una muestra aleatoria de 90 estudiantes universitarios, se
encuentra que 28 van en bicicleta a la escuela?. Utilice un nivel de significancia de 0.05.
Datos:
X ~ N μ x 22.5, σ x 4.10
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
x μ
Z
σ
28 22.5
Z 1.338877 1.34
4.107919
Respuesta:
No rechazamos la hipótesis nula ya que no hay suficiente evidencia para concluir que P> 0.25.
En un estudio para estimar la proporción de residentes de cierta ciudad y sus suburbios que están a
favor de la construcción de una planta de energía nuclear, se encuentra que 63 de 100 residentes
urbanos están a favor de la construcción mientras que solo 59 de 125 residentes suburbanos la
favorecen. ¿ Hay una diferencia significativa entre la proporción de residentes urbanos y suburbanos
que favorecen la construcción de la planta nuclear?. Use un valor P.
Datos:
P1 : residentes urbanos de cierta ciudad.
P2 : residentes suburbanos de cierta ciudad.
p1 : proporción de residentes urbanos a favor de la construcción de una planta de energía nuclear.
p2 : proporción de residentes suburbanos a favor de la construcción de una planta de energía nuclear.
Tamaño de la primer muestra n1 = 100 residentes urbanos.
Tamaño de la segunda muestra n2 = 125 residentes suburbanos.
Cantidad de urbanos a favor x1 = 63 residentes urbanos.
Cantidad de suburbanos a favor x2 = 59 residentes suburbanos.
x1 63
Proporción de urbanos a favor p̂1 0.63
n 1 100
x 59
Proporción de suburbanos a favor p̂ 2 2 0.472
n 2 125
x x2 63 59 122
Combinación de las proporciones p̂ 1 0.542
n 1 n 2 100 125 225
Hipótesis nula H0: p1 = p2.
Hipótesis alternativa H1: p1 ≠ p2.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
pˆ 1 pˆ 2
z
pˆ qˆ 1 n1 1 n2
0.63 0.472 0.158 0.158 0.158
z 2.36
0.542 0.458 0.018 0.0044 0.066
0.542 0.458 1 1
100 125
P(z > 2.36 ) = 2* P(z > 2.36) = 2*(1 – 0.9909) = 0.0182 = 1.82%
Respuesta:
Rechazamos la hipótesis nula ya que hay una probabilidad de que ocurra del 1.82%. La proporción de los
residentes urbanos a favor de la construcción de una planta de energía nuclear es mayor que la proporción de
los residentes suburbanos a favor de la construcción de dicha planta.
En un estudio sobre la fertilidad de mujeres casadas por Martín O`Connell y Carolyn C. Rogers para la
Oficina de Censos en 1979, se seleccionaron al azar dos grupos de esposas con edades de 25 a 29 sin
hijos y a cada mujer se le preguntó si planeaba tener un hijo. Se seleccionó un grupo entre las mujeres
con menos de dos años de casadas y otro entre las que tenían cinco años de casadas. Suponga que 240
de 300 con menos de dos años de casadas planean tener algún día un hijo comparadas con 288 de las
400 con cinco años de casadas. ¿ Podemos concluir que la proporción de mujeres con menos de dos
años de casadas que planean tener hijos es significativamente más alta que la proporción con cinco años
de casadas?. Use un valor P.
Datos:
P1 : mujeres con menos de dos años de casada.
P2 : mujeres con cinco años de casadas.
p1 : proporción de mujeres con menos de dos años de casadas.
p2 : proporción de mujeres con cinco años de casadas.
Tamaño de la primer muestra n1 = 300 mujeres con menos de dos años de casadas.
Tamaño de la segunda muestra n2 = 400 mujeres con cinco años de casadas.
Cantidad con menos de dos años de casadas x1 = 240 mujeres.
Cantidad con cinco años de casadas x2 = 288 mujeres.
x 1 240
Proporción con menos de dos años p̂1 0.80
n 1 300
x 2 288
Proporción con cinco años p̂ 2 0.72
n 2 400
x x 2 240 288 528
Combinación de las proporciones pˆ 1 0.754
n1 n2 300 400 700
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Utilizamos la aproximación normal
pˆ 1 pˆ 2
z
pˆ qˆ 1 n1 1 n2
Respuesta:
Rechazamos la hipótesis nula. La proporción de mujeres con menos de 2 años de casadas que planean tener
hijos es considerablemente más alta que la proporción de mujeres con 5 años de casadas que planean tener
hijos.
Cinco muestras de una sustancia ferrosa se usan para determinar si hay una diferencia entre un
análisis químico de laboratorio y un análisis de fluorescencia de rayos X del contenido de hierro. Cada
muestra se divide en dos submuestras y se aplican los dos tipos de análisis. A continuación se presentan
los datos codificados que muestran los análisis de contenido de hierro:
Muestra
Análisis 1 2 3 4 5
Rayos X 2,0 2,0 2,3 2,1 2,4
Químico 2,2 1,9 2,5 2,3 2,4
Suponga que las poblaciones son normales, pruebe con un nivel de signficancia de 0.05 si los dos
métodos de análisis dan, en promedio, el mismo resultado.
Datos:
Tamaño de la muestra n = 5 muestras.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Región critica t t t
2 2
t 0.05 t t 0.05
2 2
t 0.025 t t 0.025 Aplicando Tabla A.4.
2.776 t 2.776
_
d d 0
Donde t s con v = n-1 grados de libertad
d
n
Calculando:
n
d
La media muestral _ i 1 i
d
n
Muestra
Análisis 1 2 3 4 5
Rayos X 2,0 2,0 2,3 2,1 2,4
Químico 2,2 1,9 2,5 2,3 2,4
_
d
0.2 0.1 0.2 0.2 0.0 0.1
5
la desviación estándar
2
n
n
n * d i2 - d i
i 1 i 1
sd
n * n 1
sd
2 2 2
5 * - 0.2 0.1 - 0.2 - 0.2 0.0 - 0.2 0.1 0.2 0.2 0.0
2 2 2
5 * 5 1
5 * 0.13 - 0.5
2
0.4
sd 0.1414
5 * 4 20
_
d d 0
Calculamos t s con nuestros datos
d
n
0.1
t 1.58
0.1414
5
Respuesta:
No rechazamos la hipótesis nula. Concluimos que ambos métodos no son considerablemente diferentes.
mismos autos se equipan con llantas comunes con cinturón y se manejan otra vez por el recorrido de
prueba. El consumo de gasolina, en kilómetros por litro, se registró como sigue:
¿ Podemos concluir que los autos equipados con llantas radianes dan una economía de combustible
mejor que los equipados con llantas de cinturón?. Suponga que las poblaciones se distribuyen
normalmente. Utilice un valor P en su conclusión.
Datos:
Tamaño de la muestra n = 12 autos.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d d 0
Donde t s con v = n-1 grados de libertad
d
n
Calculando:
n
d
La media muestral _ i 1 i
d
n
_
d
0.1 0.2 0.4 0.1 0.1 0.1 0.0 0.2 0.5 0.2 0.1 0.3 0.1417 Km
12
la desviación estándar
2
n
n
n * d i2 - d i
i 1 i 1
sd
n * n 1
12 * 0.67 - 1.7
2
5.15
sd 0.198 Km
12 * 11 132
_
d d 0
Calculamos t s con nuestros datos
d
n
0.1417
t 2.48
0.198
12
Y P = P( t > 2.48) = 0.02 con 11 grados de libertad
Respuesta:
Rechazamos hipótesis nula ya que el nivel de significancia esta por encima del 0.02.
Datos:
Tamaño de la muestra n = 7 mujeres.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
_
d d 0
Donde t s con v = n-1 grados de libertad
d
n
Calculando:
n
d
La media muestral _ i 1 i
d
n
Mujeres
Peso 1 2 3 4 5 6 7
Antes 58,5 60,3 61,7 69,0 64,0 62,6 56,7
Después 60,0 54,9 58,1 62,1 58,5 59,9 54,4
di -1,5 5,4 3,6 6,9 5,5 2,7 2,3
_
d
1.5 5.4 3.6 6.9 5.5 2.7 2.3 3.557 Kilogramos
7
la desviación estándar
2
n
n
n * d i2 - d i
i 1 i 1
sd
n * n 1
7 * 134.81 - 24.9
2
323.66
sd 2.776 Kilogramos
7 * 6 42
_
d d 0 3.557 4.5
t t 0.896
Calculamos sd con nuestros datos 2.776
n 7
Respuesta:
No rechazamos la hipótesis nula.
comparación de residuos de ácido sórbico, en partes por millón, en jamón inmediatamente después de
sumergirlo en una solución de ácido y después de 60 días de almacenamiento:
Si se supone que las poblaciones se distribuyen normalmente, ¿ hay suficiente evidencia, al nivel de
significancia de 0.05, para decir que la duración del almacenamiento influye en las concentraciones
residuales de ácido sórbico?
Datos:
Tamaño de la muestra n = 8 rebanadas.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Región critica t t t
2 2
t 0.05 t t 0.05
2 2
t 0.025 t t 0.025 Aplicando Tabla A.4.
2.365 t 2.365
_
d d 0
Donde t s con v = n-1 grados de libertad
d
n
Calculando:
n
d
La media muestral _ i 1 i
d
n
2 270 96 174
3 400 239 161
4 444 329 115
5 590 437 153
6 660 597 63
7 1400 689 711
8 680 576 104
_
d
108 174 161 115 153 63 711 104 198.625
Millón/partes
8
la desviación estándar
2
n
n
n * d i2 - d i
i 1 i 1
sd
n * n 1
8 * 624801 - 1589
2
2473487
sd 210.165 Millón/partes
8 * 7 56
_
d d 0
Calculamos t s con nuestros datos
d
n
198.625
t 2.67
210.165
8
Respuesta:
Rechazamos la hipótesis nula. La duración de almacenamiento influye en las concentraciones residuales de
ácido sórbico.
x 0 1 2 3
f 1 31 55 25
Pruebe la hipótesis con un nivel de significancia de 0.05 de que los datos registrados se pueden ajustar
con una distribución hipergeométrica h (x; 8, 3, 5), x = 0, 1, 2, 3.
Datos:
Variable aleatoria X: números de canicas rojas.
Repeticiones del experimento m = 112 veces.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
k N k
Aplicando la distribución hipergeométrica a nuestros datos:
N
n
5 8 3
03 1
P(x = 0)=
0.1786 e0 = (112)*(0.01786) = 2.
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 79 de 103
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 3
13 2531
P(x = 1)=
0 .2 6 7 8 e1 = (112)*(0.26786) = 30.
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 80 de 103
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 3
23 103
P(x = 2)=
8 56
3
Lafata Desio Fernando, Warlet Iván Lautaro Página 81 de 103
Cátedra: Probabilidad y Estadística Trabajo Final
UADER 6 de Agosto de 2008
5 8 3
3 01
P(x = 3)=
0 .1 7 8 5 e3 = (112)*(0.17857) = 20.
8 56
3
I xi P(x = xi) ei = mpi oi j
1 0 0.01786 2 1 1
2 1 0.26786 30 31
3 2 0.53571 60 55 2
4 3 0.17857 20 25 3
Totales ~1 112 112
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de cuatro a tres, lo que tiene como resultado υ = 2 grados de libertad.
Una prueba de la bondad de ajuste entre las frecuencias observadas y esperadas se basa en la cantidad
2
n oi ei 2
i 1 ei
Donde 2 es un valor de una variable aleatoria cuya distribución muestral se aproxima muy de cerca con la
distribución ji cuadrada con υ = k – 1grados de libertad. Los símbolos oi y ei representan las frecuencias
observada y esperada, respectivamente, para la i-ésima celda.
2
n o i ei 2 32 32 2 55 60 2 25 20 2 25 25
0 1.667
i 1 ei 32 60 20 60 20
Para un nivel de significancia igual a α, encontramos el valor crítico 2 de la tabla A.5., y entonces 2 2
constituye la región critica.
Con el uso de la tabla A.5., encontramos 02.05 = 5.991 con υ = 2 grados de libertad.
Respuesta:
Como 2 2 , 1.667 < 5.991, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es hipergeométrica.
x 1 2 3 4 5 6 7 8
f 136 60 34 12 9 1 3 1
Prueba la hipótesis con un nivel de significancia de 0.05 de que la distribución observada de X se puede
ajustar por una distribución geométrica g (x; 1/2), x = 1, 2, 3,......
Datos:
Variable aleatoria X: números de lanzamientos hasta que sale una cara.
Repeticiones del experimento m = 256 veces.
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de ocho a seis, lo que tiene como resultado υ = 5 grados de libertad.
2
n oi ei 2 136 128 2 60 64 2 34 32 2 12 16 2 9 8 2 5 8 2 64 16 4 16 1 9 25
i 1 ei 128 64 32 16 8 8 128 64 32 16 8 8 8
2
Para un nivel de significancia igual a α, encontramos el valor critico de la tabla A.5., y entonces 2 2
constituye la región critica.
Con el uso de la tabla A.5., encontramos 02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como 2 2 , 3.125 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es geométrica.
Datos:
Calificaciones m = 60.
Intervalos i = 9.
Media μ = 65.
Desviación estándar σ = 21.
De acuerdo con el ejercicio 1 de la página 68, los intervalos y las frecuencias que se observan son
i Limite de oi
clases
1 - ∞ – 19.5 3
2 19.5 – 29.5 2
3 29.5 – 39.5 3
4 39.5 – 49.5 4
5 49.5 – 59.5 5
6 59.5 – 69.5 11
7 69.5 – 79.5 14
8 79.5 – 89.5 14
9 89.5 – + ∞ 4
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
65 19.5 65 45.5
z11 z12 2.17
21 21 21 21
de la tabla A.3. encontramos que el área entre z 11 y z12 es
P(- ∞< z < -2.17) = P(z < -2.17) – P(z < - ∞) = 0.0150 – 0 = 0.0150
De aquí, la frecuencia esperada para la primer clase es
e1 = (60)*(0.0150) = 0.9
89.5 65 24.5 65
z 91 1.17 z 92
21 21 21 21
de la tabla A.3. encontramos que el área entre z 91 y z92 es
P(1.17 < z < +∞) = P(z < +∞) – P(z < 1.17) = 1 – 0.8790 = 0.121
De aquí, la frecuencia esperada para la novena clase es
e9 = (60)*(0.121) = 7.26
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de nueve a seis, lo que tiene como resultado υ = 5 grados de libertad.
2
Para un nivel de significancia igual a α, encontramos el valor critico de la tabla A.5., y entonces 2 2
constituye la región critica.
Con el uso de la tabla A.5., encontramos 02.05 = 11.070 con υ = 5 grados de libertad.
Respuesta:
Como 2 2 , 6.11 < 11.070, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
Datos:
Calificaciones m = 40.
Intervalos i = 10.
Media μ = 1.8.
Desviación estándar σ = 0.4.
De acuerdo con el ejercicio 5 de la página 69, los intervalos y las frecuencias que se observan son
i Limite de oi
clases
1 - ∞ – 0.795 1
2 0.795 – 0.995 1
3 0.995 – 1.195 1
4 1.195 – 1.395 2
5 1.395 – 1.595 4
6 1.595 – 1.795 13
7 1.795 – 1.995 8
8 1.995 – 2.195 5
9 2.195 – 2.395 3
10 2.395 – + ∞ 2
Incógnita:
Rechazo o No Rechazo de la hipótesis nula.
Solución:
Los valores z que corresponden a los límites de las clases son:
P(-1.01 < z < -0.51) = P(z < -0.51) – P(z < -1.01) = 0.3050 – 0.1562 = 0.1488
De aquí, la frecuencia esperada para la quinta clase es
e5 = (40)*(0.1488) = 5.952
Combinamos las clases adyacentes, donde las frecuencias esperadas son menores que cinco. En consecuencia,
el numero total de intervalos se reduce de diez a seis, lo que tiene como resultado υ = 5 grados de libertad.
n o ei
2
5 6.248 2 4 5.952 2 13 7.64 2 8 7.676 2 5 6.04 2 5 6.444 2
2 i
i 1 ei 6.248 5.952 7.64 7.676 6.04 6.444
1.56 3.81 28.73 0.10 1.08
2.08 5.166
6.248 5.952 7.64 7.676 6.04 6.444
2
Para un nivel de significancia igual a α, encontramos el valor critico de la tabla A.5., y entonces 2 2
constituye la región critica.
Con el uso de la tabla A.5., encontramos 02.01 = 15.086 con υ = 5 grados de libertad.
Respuesta:
Como 2 2 , 5.166 < 15.086, No se rechaza la hipótesis nula. Concluimos que no hay suficiente evidencia
para sospechar que la distribución no es normal.
No Fumadores Fumadores
fumadores modernos empedernidos
Con hipertensión 21 36 30
Sin hipertensión 48 26 19
Datos:
Incógnita:
Dependencia o no de la hipertensión de los hábitos de fumar.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 2 3 y definimos los
siguientes eventos.
N: Un individuo seleccionado es no fumador.
M: Un individuo seleccionado es fumador moderado.
E: Un individuo seleccionado es fumador empedernido.
S: Un individuo seleccionado tiene hipertensión.
C: Un individuo seleccionado no tiene hipertensión.
Tabla de contingencia 2 X 3:
N M E Total
C 21 36 30 87
S 48 26 19 93
Total 69 62 49 180
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
69
P N ≃ 0.383
180
62
P M ≃ 0.344
180
49
P E ≃ 0.272
180
87
P C ≃ 0.483
180
93
P S ≃ 0.517
180
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P N C P N P C
69 87
≃ 33.35
180
P N S P N P S
69 93
≃ 35.65
180
P M C P M P C
62 87
≃ 29.97
180
P M S P M P S
62 93
≃ 32.03
180
P E C P E P C
49 87
≃ 23.68
180
P E S P E P S
49 93
≃25.32
180
N M E Total
C 33.35 29.97 23.68 87
S 35.65 32.03 25.32 93
Total 69 62 49 180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, que dice:
Calcular
2 o i ei 2
i ei
n o ei 2 21 33.35 2 36 29.97 2 30 23.68 2 48 35.65 2 26 32.03 2 19 25.32 2
2 i
i 1 ei 33.35 29.97 23.68 35.65 32.03 25.32
152.52 36.36 39.94 152.52 36.36 39.94
14.46
33.35 29.97 23.68 35.65 32.03 25.32
Si 2 2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que 02.05 = 5.991 para υ = (2 – 1)(3 – 1) = 2 grados de libertad.
Respuesta:
Como 2 2 , 14.46 > 5.991, se rechaza la hipótesis nula. Concluimos que la presencia o ausencia de
hipertensión y el hábito de fumar no son independientes.
Número de hijos
Educación 0-1 2-3 Over 3
Elemental 14 37 32
Secundaria 19 42 17
Universidad 12 17 10
Datos:
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 3 y definimos los
siguientes eventos.
E: Un hombre seleccionado tiene un nivel de educación elemental.
S: Un hombre seleccionado tiene un nivel de educación secundaria.
U: Un hombre seleccionado tiene un nivel de educación universitaria.
0: Un hombre seleccionado tiene a lo más un hijo.
2: Un hombre seleccionado tiene entre dos y tres hijos.
3: Un hombre seleccionado tiene más de tres hijos.
Tabla de contingencia 3 X 3:
0 2 3 Total
E 14 37 32 83
S 19 42 17 78
U 12 17 10 39
Total 45 96 59 200
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
83
P E ≃ 0.415
200
78
P S ≃ 0.39
200
39
P U ≃0.195
200
45
P 0 ≃ 0.225
200
96
P 2 ≃ 0.48
200
59
P 3 ≃ 0.295
200
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P E 0 P E P 0
83 45
≃ 18.675
200
P E 2 P E P 2
83 96
≃ 39.84
200
P E 3 P E P 3
83 59
≃ 24.485
200
P S 0 P S P 0
78 45
≃ 17.55
200
P S 2 P S P 2
78 96
≃ 37.44
200
P S 3 P S P 3
78 59
≃ 23.01
200
P U 0 P U P 0
39 45
≃ 8.775
200
P U 2 P U P 2
39 96
≃18.72
200
P U 3 P U P 3
39 59
≃ 11.505
200
0 2 3 Total
E 18.675 39.84 24.485 83
S 17.55 37.44 23.01 78
U 8.775 18.72 11.505 39
Total 45 96 59 180
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
2
n oi ei 2 14 18.675 2 37 39.84 2 32 24.485 2 19 17.55 2 42 37.44 2 17 23.01 2 12 8.775 2
i 1 ei 18.675 39.84 24.485 17.55 37.44 23.01 8.775
De la tabla A.5. encontramos que 02.05 = 9.488 para υ = (3 – 1)(3 – 1) = 4 grados de libertad.
Respuesta:
Como 2 2 , 7.46 < 9.488, no se rechaza la hipótesis nula. Concluimos que el tamaño de la familia es
independiente del nivel de instrucción del padre.
Tipo de crimen
Distrito Asalto Robo Hurto Homicidio
1 162 118 451 18
2 310 196 996 25
3 258 193 458 10
4 280 175 390 19
Datos:
Incógnita:
Dependencia o no del tamaño de la familia del nivel de instrucción del padre.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 4 4 y definimos los
siguientes eventos.
A: El tipo de crimen es asalto.
R: El tipo de crimen es robo.
U: El tipo de crimen es hurto
H: El tipo de crimen es homicidio
1: El distrito seleccionado es el 1.
2: El distrito seleccionado es el 2.
3: El distrito seleccionado es el 3.
4: El distrito seleccionado es el 4
Tabla de contingencia 4 X 4:
A R U H Total
1 162 118 451 18 749
2 310 196 996 25 1527
3 358 193 458 10 1019
4 280 175 390 19 864
Total 1110 682 2295 72 4159
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad:
1110
P A ≃ 0.27
4159
682
P R ≃ 0.16
4159
2295
P U ≃0.55
4159
72
P H ≃0.02
4159
749
P1 ≃ 0.18
4159
1527
P 2 ≃ 0.37
4159
1019
P 3 ≃ 0.24
4159
864
P 4 ≃ 0.21
4159
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P A 1 P A P1
1110 749
≃ 199.90
4159
P U 1 P U P1
2295 749
≃ 413.31
4159
P A 2 P A P 2
1110 1527
≃ 407.55
4159
P U 2 P U P 2
22951527
≃ 842.62
4159
P A 3 P A P 3
1110 1019
≃ 271.96
4159
P U 3 P U P 3
22951019
≃ 562.30
4159
P A 4 P A P 4
1110 864
≃ 230.59
4159
P U 4 P U P 4
2295 864
≃ 476.77
4159
P R 1 P R P1
682 749
≃ 122.82
4159
P H 1 P H P1
72 749
≃ 12.97
4159
P R 2 P R P 2
6821527
≃ 250.40
4159
P H 2 P H P 2
721527
≃ 26.43
4159
P R 3 P R P 3
6821019
≃ 167.10
4159
P H 3 P H P 3
72 1019
≃ 17.64
4159
P R 4 P R P 4
682 864
≃ 141.68
4159
P H 4 P H P 4
72 864
≃ 14.96
4159
A R U H Total
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
2
n oi ei
2
162 199.9 2 118 122.82 2 451 413.31 2 18 12.96 2 310 407.54 2 196
i1 ei 199.9 122.82 413.31 12.96 407.54
25 26.43 2 358 271.96 2 193 167.09 2 458 562.3 2 10 17.64 2 280 230.59 2 175
26.43 271.96 167.09 562.3 17.64 230.59 14
19 14.96 1436.41 23.23 1420.53 25.40 9514.05 2959.36 23525.42 2.04 7402.88 671.3
2
14.96 199.9 122.82 413.31 12.96 407.54 250.4 842.62 26.43 271.96 167.0
1096.27 7527.29 16.32
165.01
141.89 476.76 14.96
Si 2 2 con υ =(r – 1)(c – 1) grados de libertad, rechazar la hipótesis nula de independencia.
De la tabla A.5. encontramos que 02.01 = 21.666 para υ = (4 – 1)(4 – 1) = 9 grados de libertad.
Respuesta:
Como 2 2 , 165.01 > 21.666, se rechaza la hipótesis nula. Concluimos que el tipo de crimen no es
independiente del distrito de la ciudad.
Pruebe la hipótesis, con un nivel de significancia de 0.05, de que los tres remedios para la tos son
igualmente efectivos.
Datos:
Incógnita:
Homogeneidad o no entre los remedios.
Solución:
Buscamos las frecuencias marginales, para ello armamos una tabla de contingencia de 3 3 y definimos los
siguientes eventos.
S: El remedio no proporciona alivio.
A: El remedio proporciona cierto alivio.
C: El remedio proporciona alivio completo.
N: El remedio seleccionado es NyQuil.
R: El remedio seleccionado es Robitussin.
T: El remedio seleccionado es Triaminic.
Tabla de contingencia 3 X 3:
N R T Total
S 11 13 9 33
A 32 28 27 87
C 7 9 14 30
Total 50 50 50 150
Con el uso de las frecuencias marginales, podemos listar las siguientes estimaciones de probabilidad.
33
P S = 0.22
150
87
P A ≃ 0.053
150
30
P C = 0.2
150
50
P N ≃ 0.33
150
50
P R ≃ 0.33
150
50
P T ≃ 0.34
150
Ahora si H0 es verdadera y las dos variables son independientes, debemos tener las siguientes frecuencias
esperadas:
P S N P S P N
33 50
= 11
150
P S R P S P R
33 50
= 11
150
P S T P S P T
33 5
= 11
150
P A N P A P N
87 50
= 29
150
P A R P A P R
87 50
= 29
150
P A R P A P R
87 50
= 29
150
P C N P C P N
30 50
= 10
150
P C R P C P R
30 50
=10
150
P C R P C P R
30 50
= 10
150
N R T Total
S 11 11 11 33
A 29 29 29 87
C 10 10 10 30
Total 50 50 50 150
Para probar la hipótesis nula de independencia. Usamos el criterio de decisión siguiente, con nuestros datos:
2
n oi ei 2 11 11 2 13 11 2 9 11 2 32 29 2 28 29 2 27 29 2 7 10 2 9 10 2 14 10 2
i 1 ei 11 11 11 29 29 29 10 10 10
4 4 9 1 4 9 1 16
0 3.81
11 11 29 29 29 10 10 10
Respuesta:
Como 2 2 , 3.81 < 9.488, no se rechaza la hipótesis nula. Concluimos que los tres remedios son
igualmente efectivos.
Bibliografías:
Walpole, Myers y Myers, “Probabilidad y Estadística para Ingenieros”, sexta
edición.
Apuntes de la cátedra.