Problemas Hipotesis PDF
Problemas Hipotesis PDF
Problemas Hipotesis PDF
2.- En una propaganda se anuncia que unas determinadas pilas proporcionan más horas
de luz que las normales. Doce personas deciden comprarlas y los resultados obtenidos
son los siguientes:
Individuo 1 2 3 4 5 6 7 8 9 10 11 12
Variación 0,2 0 1 0,6 -0,5 -0,6 -1 0,6 1 0,5 -0,4 -0,5
¿Se puede admitir, teniendo en cuenta estos datos, que el anuncio es correcto?
3.- Se intenta comparar dos métodos de enseñanza y para ello se selecciona una muestra
de 50 individuos. A 20 personas se les aplica el método A y a las otras 30 el B. Al cabo
de un año los aumentos en conocimiento han sido los siguientes
=
n A 20;= =
x A 5;S A 1, 2;=
n B 30;= =
x B 3;S B 0,9 . Contrastar la hipótesis de igualdad
de varianzas y de igualdad de medias al 95%.
4.- De 1000 familias con 5 hijos cada una se ha analizado la distribución de la variable
X =”número de hijos varones, obteniéndose los siguientes resultados:
X 0 1 2 3 4 5
Nº de familias 26 162 309 321 153 29
¿Se puede afirmar que la variable X sigue una distribución binomial B(5,p)?
5.- Un tipógrafo asegurar que el número medio de errores por página que comete es 2,
mientras el editor sospecha que es mayor. Suponiendo que el número de errores por
página sigue una distribución de Poisson y que en una muestra de 200 páginas se
encontraron 450 errores, especificar las hipótesis nula y alternativa del contraste y
realizar el contraste con un nivel de significación del 5%.
6.- Un fabricante de bolsas de plástico asegura que el 95% de sus bolsas resisten 6 kg o
más. Se toman 40 de estas bolsas al azar y se llenan con 6 kg rompiéndose 6 de ellas.
¿Existe evidencia estadística para rechazar la afirmación del fabricante?
7.- Se sabe que la renta anual de los individuos de un país sigue una distribución normal
de media desconocida y de desviación típica 1.400. Se ha observado la renta anual de 16
individuos escogidos al azar y se ha obtenido un valor medio de 19.500 euros.
Contrastar, a un nivel de significación del 5%, si la media de la distribución es de
18.000 de euros.
10.- Se quiere comprobar si existe alguna relación entre las calificaciones de los
alumnos en el tipo de asignaturas superadas. Para ello se ha tomado una muestra con
alumnos de las tres asignaturas siguientes:
Aprobado Notable Sobresaliente Total
Geomática 152 99 29 280
Matemáticas 35 28 17 80
Física 12 18 10 40
Total 199 145 56 400
Contrastar la independencia con el test de la Chi-cuadrado. ¿Qué ocurre si
consideramos sólo las asignaturas de Matemáticas y Física?
12.- Queremos contrastar la hipótesis H0: “la duración media de los motores de una
determinada marca es 180.000 km”. Para ello se toma una muestra de 9 motores de
automóviles, obteniéndose una media de 150.000 km y una varianza muestral
S2=(30.000)2. Estudiar si debemos aceptar la hipótesis H0 con un nivel de confianza del
95%.
16.- Se tabulan los errores de cierre en nivelación obtenidos en 1000 polígonos. ¿Se
puede admitir que el error de cierre se distribuye normalmente? Contrastar la bondad
del ajuste mediante la χ 2n con α=0,05.
error de cierre n° de polígonos
0 -0,1 64
0,1-0,2 242
0,2-0,3 390
0,3-0,4 238
0,4-0,5 66
17.- La siguiente tabla contiene los datos de dos muestras de tamaño 50. ¿Podemos
admitir que tienen la misma distribución utilizando el estadístico de Pearson y
calculando el p-valor?
1ª muestra 2ª muestra
3 1
2 4
4 9
11 5
11 10
9 9
5 4
3 4
2 4
18.- A la vista de los datos que aparecen en la tabla adjunta, obtenidos después de una
encuesta realizada para ver si la edad tiene influencia en los errores cometidos por los
observadores. ¿Se puede admitir que el cometer errores es independiente de la edad?
Edad Cometer No cometer
error error
<30 38 44
30-40 45 28
40-50 30 54
50-60 22 62
>60 20 57
20.- Al calcular cinco veces la distancia entre dos puntos, obtenemos los siguientes
valores:
170,13m; 170,12m; 170,2m; 170,65m; 170,4
Se pide:
a) Intervalo de confianza del 80% para la media.
b) ¿Cuál será el número de mediciones necesaria para que el error sea inferior a 0,1 m
con un nivel de significación de 0,2?
c) Intervalo de confianza del 90% para la varianza obtenida.
d) Si la variable medida del ángulo es normal ¿aceptamos una desviación típica inferior
a 0,1 m con un nivel de significación 0,1?
22.- Se quiere comprobar si es cierto que un nuevo modelo de automóvil consume 5,7
litros por cada 100 km a 90 km/h tal y cómo afirma en su propaganda. Para ello se
realizan 10 recorridos de 100 km a dicha velocidad, con los siguientes consumos:
5,8; 6,3; 6; 5,5; 6,1; 6,5; 5,5; 7; 6,8; 5,7
Se pide:
a) Intervalo de confianza para la media obtenida con un nivel de significación del 0,05.
b) ¿Se puede aceptar la afirmación del fabricante al 95%?
23.- Un jugador afirma que los dos dados que utiliza no están trucados. Para comprobar
esta afirmación, se lanzan los dos dados 360 veces y se anota la suma de los resultados.
Dichas sumas se muestran en la siguiente tabla, junto con su probabilidad
correspondiente (para facilitar la comparación).
Suma FRECUENCIA PROBABILIDAD
OBSERVADA
2 11 1/36
3 18 2/36
4 33 3/36
5 41 4/36
6 47 5/36
7 61 6/36
0 16
1 23
2 8
3 3
Sumas 50
Contrastar el hecho de que la distribución es de Poisson de parámetro λ=1.
25.- Para curar una enfermedad se sabe que existen cuatro tratamientos diferentes.
Aplicados por separado a unos grupos de enfermos se han observado los resultados
siguientes:
Tratamiento Curados No Curados
A 83 44
B 45 28
C 60 54
D 82 62
Total 270 188
¿Se puede asegurar que la eficacia de los cuatro tratamientos es la misma, con un nivel
de significación del 95%?
1.5 - 1.6 6
1.6 - 1.7 21
1.7 - 1.8 35
1.8 - 1.9 24
1.9 - 2.0 11
2.0 - 2.1 3
más de 2.1 0
Contrastar la hipótesis,
La muestra obtenida sigue una distribución normal N( X 1.772 , S = 0.1168)
a) Obtener el p-valor y dar su interpretación.
b) Para un nivel de significación 0.05 calcular el valor crítico.
c) ¿Se acepta el ajuste para un nivel de significación 0.05 ?
29.- Para contrastar que la esperanza matemática µ de una distribución Normal es 10, se
toma una muestra de tamaño 16 y se rechaza la hipótesis en el caso en que la media
muestral sea mayor que 10, aceptándose en caso contrario. Sabiendo que la desviación
típica de la población es σ=2 y habiendo obtenido una media muestral de 11. Calcular el
p-valor y decidir si se acepta la hipótesis de que la media de la población es µ<10
0 10
1 30
2 50
3 10
Se pide:
D=∑
i npi
c) Estudiar la Bondad del ajuste para un nivel de significiación α=0,05
31.- Suponiendo una población normal con media 50 y desviación típica 8. Para una
muestra de tamaño 9, ¿cuál es la probabilidad de que:
a) La media muestral sea superior a 55?
b) La desviación típica muestral sea superior a 10?
32.- Según un estudio sobre los hábitos de consumo de las familias de la Comunidad de
Madrid, el gasto mensual en productos de marcas blancas de las familias puede
considerarse según una variable aleatoria X con ley Normal de desviación típica 50
euros. Los datos siguientes corresponden a una muestra aleatoria simple de tamaño n =
10 familias:
Familia 1 2 3 4 5 6 7 8 9 10
Gasto 325 193 203 305 251 240 233 238 354 311
a) ¿Qué estimación del gasto medio mensual se obtiene con un estimador insesgado?
b) Calcula un intervalo de confianza al 95% para el gasto medio mensual en productos
de marcas blancas de las familias de la Comunidad de Madrid.
c) Si queremos trabajar con niveles de confianza del 90%, ¿obtendríamos un intervalo
más o menos) amplio que el calculado anteriormente?
33.- Se sabe que la demanda diaria de un producto fabricado por cierta empresa sigue
una distribución normal. Se toma una muestra aleatoria simple de la demanda registrada
en 10 días distintos, obteniéndose una media muestral igual a 3,5 y una desviación
típica muestral (o cuasidesviación típica) igual a 0,9. Se pide:
a) Un intervalo de confianza al 95% para la media de la demanda diaria de dicho
producto.
b) El plan de producción de la empresa está basado en la suposición de que la demanda
media diaria del citado producto es como mínimo igual a 4. Contrastar esta hipótesis, al
nivel de significación de 0,05.
34.- Se supone que el retraso de los trabajadores de una empresa es, por término medio,
de 5 minutos; para contrastar dicha hipótesis se seleccionó al azar una muestra de 10
empleados y se midió su retraso: 0.1, 2, 7, 5.6, 7.4, 5.1, 6.1, 6, 4.5 y 9. Utilizar el p-
valor.
38.- Se quiere contrastar la hipótesis nula “una moneda de un euro está bien
equilibrada”, y que por tanto, cara y cruz son equiprobables; para ello se realizan 100
lanzamientos de una moneda de un euro y se observan 63 caras y 37 cruces. Contrastar
la hipótesis utilizando el test de χ 2 con un nivel de significación α de 0,05.
39.- ¿Se puede admitir la distribución normal de valores angulares en una triangulación
de primer orden de un país en la que se ha tomado una muestra de tamaño 100 y se han
obtenido los siguientes resultados?
Medidas angulares frecuencias observadas
30-40 16
40-50 22
50-60 20
60-70 19
70-80 23
D=∑
i npi
d) Calcular el p-valor e indicar la bondad del ajuste.
e) Estudiar la Bondad del ajuste para un nivel de significiación α=0,03.
DERIVE:
#1: 2(1-(STUDENT(0.3866, 11))
#2: 0.7064262140
EXCEL:
=DISTR.T.(0,3866;11;2) 0,70642621
SPSS:
2(1-CDF. T(0.3866,11)) 0,7
Podemos aceptar la hipótesis nula, para cualquier valor de α < 0,7 y en consecuencia
la propaganda es falsa.
SPSS:IDF.T(0.975,48) 2.01
Como 6.73 > 2 RECHAZAMOS la hipótesis de igualdad de medias.
npi
(n i − npi ) 2 k
=D ∑= 1,59
i =1 npi
utilizando el p-valor:
DERIVE: 1 - CHI_SQUARE(1.59,4)= 0.8105883166> α
EXCEL: = DISTR.CHI(1,59;4) 0,810588> α
SPSS: 1 - CDF.CHISQ(1.59,4) .81> α
Para α = 0,05 P(χ 4 ≤ χ 0,95
= ) 0,95 ⇒ χ=
2
0,95 9,49 siendo D = 1,59 menor
que χ0.95 aceptamos la hipótesis de ser el ajuste bueno. La diferencia entre la
distribución empírica y la ley de la distribución binomial no es significativa.
Aceptamos el ajuste para todo nivel de significación menor que 0,81.
Para realizar el contraste se extrae una muestra {x1 , x 2 ,..., x n } con n=200.
La variable Y = X1 + X 2 + ... + X n que representa el número de errores en n páginas,
sigue una distribución aproximadamente Normal (Teorema Central del Límite)
Y − E [Y]
(
Y ≡ N E [Y], V [Y] ⇒ ) V [Y]
≡ N(0,1)
Entonces:
E [ Y ] = E [ X1 + ... + X n ] = nλ = 400
V [ Y ] = V [ X1 + ... + X n ] = nV [ X ] = nλ = 400
Y − E [ Y ] 450 − 400
=Z = = 2,5
V [Y] 400
Para α =0,05 en la N(0,1) tenemos que:
P ( Z < z1−α ) =1 − α ⇔ P ( Z < 1, 6448 ) ≈ 0,95 ⇒ z0,95 =1, 6448
Como el valor de nuestro estadístico Z bajo la hipótesis nula cae fuera de la región de
aceptación (2,5>1,64), se RECHAZAMOS la hipótesis nula y se puede concluir que el
número de errores por página es superior a 2.
DERIVE:
#1: NSOLVE(NORMAL(λ) = 0.95, λ, Real)
#2: λ = 1.644853651
EXCEL: =DISTR.NORM.INV(0,95;0;1) 1.6448536
SPSS: IDF. NORMAL(0.95, 0,1) 1,64
Como el valor de nuestro estadístico Z bajo la hipótesis nula cae fuera de la región de
aceptación ( Z z1 /2 ), RECHAZAMOS la hipótesis nula, y la media no puede ser
18.000 euros.
b) utilizando el p-valor:
p 1 P(1,66 Z 1,66) 2P(Z 1,66) 2 1 P(Z 1,66
2 1 F(1,66) 0,0969
DERIVE: 2(1 -NORMAL(1.66))= 0.09691445252 >
EXCEL: = 2(1-DISTR.NORM.ESTAND(1,66)) 0,09691445 >
SPSS: 2 * (1- CDF.NORMAL(1.66,0,1)) .1 >
Para CUALQUIER < 0,1 = P-VALOR aceptamos la hipótesis de igualdad de
media.
∑x n i i
360
verosimilitud es la media muestral X , que en nuestro caso es=
X i =0
= = 3
n 120
Calculamos la distribución teórica de tal forma que la última opción sea X= 7 o superior
λ k −λ 3k −3
p=
k = k)
P(X = e= e
k! k!
X ni pi n pi
0 8 0,04978707 5,9744482
1 19 0,14936121 17,9233446
2 22 0,22404181 26,8850169
3 24 0,22404181 26,8850169
4 23 0,16803136 20,1637627
5 15 0,10081881 12,0982576
6 5 0,05040941 6,04912881
≥ 𝟕𝟕 4 0,033508536 4,02102426
Debemos agrupar las dos últimas clases para cumplir el requisito de npi>5
X ni n pi ni - n pi (ni - n pi)^2 (ni-npi)^2/(npi)
0 8 5,9744482 2,0255518 4,10286008 0,68673456
1 19 17,9233446 1,07665539 1,15918682 0,06467469
2 22 26,8850169 -4,88501691 23,8633902 0,88760927
3 24 26,8850169 -2,88501691 8,32332258 0,30958964
4 23 20,1637627 2,83623732 8,04424211 0,39894549
5 15 12,0982576 2,90174239 8,42010891 0,69597699
≥6 9 10,0701531 -1,07015307 1,14522759 0,11372494
sumas 120 120 3,15725558
(n i − npi ) 2
k
Pearson es D ∑
El estadístico de= ≈ 3,16
i =0 npi
Como quedan 7 clases resulta una distribución chi- cuadrado con 5 grados de libertad.
utilizando el p-valor:
DERIVE: 1 - CHI_SQUARE(3.16,5)= 0.6753340614> α
EXCEL: = DISTR.CHI(3,16;5) 0.675334066> α
SPSS: 1 - CDF.CHISQ(3.16,5) .68> α
Solución:
a)
Tenemos una muestra de tamaño grande (n=40) y varianza desconocida de una
distribución normal:
S S
I X z1 /2 , X z1 /2
n n
Datos: X 18.5 ; S 4; 0.05 y en la distribución normal
P(Z z1 /2 ) F(z1 /2 ) 1 0.975 z1 /2 1.96
2
4 4
I0.05 18.5 1.96 ,18.5 1.96 17.867545,19.132455
40 40
b)
H0: 18.5 .
H1: 18.5
20 I 0.05 17.867545,19.132455 Rechazamos la hipótesis nula H0.
X 18.5 20
Otro método puede ser, Z 2.3717 1.96,1.96 la muestra no
/ n 4 / 40
es comparable a la población.
Solución:
σ 14
La distribución de la media muestral es ξ ≡=
N µ, N=
95, N ( 95, 2 )
n 49
( )
a) F(92)= P ξ ≤ 92 ≈ 0.06680720126
DERIVE: #1: NORMAL(92,95,2)
#2: 0.06680720126
EXCEL: =DISTR.NORM.(92;95;2;1) 0,0668072
SPSS: CDF. NORMAL(92,95,2) ,06680720
0,345 < 0,64 <3,1 y por tanto aceptamos la hipótesis de varianzas iguales.
(n − 1).S2 (n − 1).S2
a) P < σ2 < = 1− α
k2 k1
P ( χ19
2
< k1 ) =0.005
Buscaremos los valores de k1 y k2 tales que: , obtenemos
P ( χ19
2
< k2 ) =0.995
k1=6,84397146 y k2= 38,5822565
19 ⋅ 6 19 ⋅ 6
P < σ2 < = 0,99 ⇒ 2,95 < σ2 < 16, 66
38,5822565 6,84397146
b) H0: σ 2 ≤ 5 .
H1: σ 2 > 5
2
Aplicando el teorema de Fisher (n − 1) S 2 ≡ χ n2 −1 ⇒ (20 − 1)
6
= 22.8
σ 5
P (χ 2
n −1 ≤ χ1−α ) = 1 − α para n-1=19 y=
α 0.01 ⇒ χ0.99
= 36.19 .
ni x i x i n i x i2 n i
(n i − np i )2
error pi npi
np i
<0 0 0,006209665 6,20966532 6,20966532
0 -0.1 64 0,05 3,2 0,16 0,060597536 60,5975359 0,19104344
0.1-0.2 242 0,15 36,3 5,445 0,241730337 241,730337 0,00030082
0.2-0.3 390 0,25 97,5 24,375 0,382924923 382,924923 0,13072203
0.3-0.4 238 0,35 83,3 29,155 0,241730337 241,730337 0,05756587
0.4-0.5 66 0,45 29,7 13,365 0,060597536 60,5975359 0,48164694
0.5< 0 0,006209665 6,20966532 6,20966532
1000 250 72,5 1 1000 13,280609
Tenemos que calcular la media y la desviación típica de la distribución Normal.
Para ello consideramos la muestra obtenida:
∑ ∑
2
xini xi ni 2
x= =0,25; σ =
2
− x =0,01
n n
Para estimar la media y la desviación típica de la población utilizamos los
resultados anteriores teniendo en cuenta que debemos considerar la cuasivarianza, es
n 2
decir, S=2
σ= 0, 01001001 y por tanto s=0,1. Consideramos la población con
n −1
distribución N(0.25,0.1).
La prueba de la bondad de ajuste de Pearson se basa en la distribución Chi-
cuadrado con k-h-1 grados de libertad, en nuestro caso k=7 (nº de intervalos), h=2 (nº de
parámetros) y para un nivel de significación α =0.05 resulta P(χ72− 2−1 > 9, 49) =0, 05 y
como D=
(n i − np i )
2
=13,28 > 9,49 SE RECHAZA EL AJUSTE.
np i
i =1 np i
Para cualquier nivel de significación α >p se rechaza la hipótesis y
consideramos que el cometer errores no es independiente de la edad.
x A − x B − ( µA − µB )
El estadístico de prueba es: = t nA +nB −2 siendo
1 1
S +
nA nB
(n A − 1)S2A + (n B − 1)SB2 8 ⋅1.22 + 8 ⋅ 0.92
=S2 = = 1.125 con lo cual:
(n A − 1) + (n B − 1) 8+8
xA − xB 5−3
= = 4
1 1 1 1
S + 1.125 +
nA nB 9 9
SPSS:IDF.T(0.975,16) 2.12
c)
(n − 1).S2 (n − 1).S2
P < σ2 < = 1− α
k2 k1
P ( χ 24 < k1 ) =0.05
Buscaremos los valores de k1 y k2 tales que: , obtenemos
P ( χ 24 < k 2 ) =0.95
k1= 0,7107230275 y k2= 9,487729072
4 ⋅ 0, 05095 4 ⋅ 0, 05095
P < σ2 < =
0,9 ⇒ 0,0215 < σ2 < 0,287
9,487729072 0,7107230275
d) H0: σ 2 ≤ 0, 01 .
H1: σ2 > 0, 01
S2 0, 05095
Sabemos que ( n − 1) ≡ χ 2n −1 ⇒ (5 − 1) =20,38
σ 2
0,12
P ( χ 2n −1 ≤ χ1−α ) = 1 − α para n-1=4 y α
= 0,1 ⇒ χ1−α=0,9
= 7,779440283 .
La región crítica es (7.779440283, +∞) .
Por tanto 7.8<20,38 se rechaza la hipótesis nula, la desviación típica no es inferior a 0,1
Solución:
a) Datos:= n 5;= X 65º 29 ' ; = S2 11,5 ⇒= S 3,39116499; = α 0, 05
Tenemos una muestra de tamaño pequeño y varianza desconocida:
S S
Iα = X − t1−α /2 , X + t1−α /2
n n
y en la distribución de Student
Buscaremos un valor t1−α /2 tal que P ( − t1−α /2 < t n −1 < t1−α /2 ) = 1 − α ⇒ t 0,975 = 2, 77644511
.
3,39116499 3,39116499
⇒ Iα=0.05 = 65º 29 '− 2, 77644511 , 65º 29 '+ 2, 77644511 =
5 5
( 65º24.79', 65º 33.21')
b)
2
S S 2 11,5
=ε t1−α /2 = ⇒ n t1−α
= 2, 77 2 ≈ 88,64944821
ε
/2
n 1
Son necesarias 89 observaciones
c)
(n − 1).S2 (n − 1).S2
P < σ2 < = 1− α
k 2 k 1
P ( χ 24 < k1 ) =0.005
Buscaremos los valores de k1 y k2 tales que: , obtenemos
P ( χ 24 < k 2 ) =0.995
k1=0,20896909 y k2= 14,860259
4 ⋅11,5 4 ⋅11,5
P < σ2 < = 0,99 ⇒ 3,10 < σ2 < 222,23
14,860259 0, 20896909
d) H0: σ2 ≤ 22 .
H1: σ 2 > 22
S2 11,5
Sabemos que ( n − 1) ≡ χ 2n −1 ⇒ (5 − 1) 2 =11,5
σ 2
2
P ( χ n −1 ≤ χ1−α ) = 1 − α para n-1=4 y=
2
α 0, 01 ⇒ χ1−α==
0,99 13, 28 .
La región crítica es (13.28, +∞) .
Por tanto 11,5<13,28 se acepta la hipótesis nula, la desviación típica es inferior a 2
∑x i
5,8 + 6,3 + 6 + 5,5 + 6,1 + 6,5 + 5,5 + 7 + 6,8 + 5, 7
=
a) X = = 6,12
n 10
∑(x )
2
−X i
=S 2
= 0, 27511 = ⇒S 0, 27511 ≈ 0,52451035
n −1
X −µ
Sabemos que el estadístico sigue una distribución t de Student con n-1 grados de
S
n
libertad.
6,12 − µ
Así pues: = t10−1 ,
0,52451035
9
S S
Buscaremos el intervalo Iα = X − t1−α /2 , X + t1−α /2 , es decir,
n n
S S
P X − t1−α /2 < µ < X + t1−α /2 = 1− α .
n n
En nuestro caso, queda:
0,52451035 0,52451035
Iα=0,05 = 6,12 − 2, 26215726 , 6,12 + 2, 26215726 ≈
10 10
( 5.75, 6.50 )
b)
H 0 : µ ≤ 5, 7
H1 : µ > 5, 7
6,12 − 5, 7
= tn-1= t10−1 = 2,5
0,52451035
10
Buscaremos un valor t1−α tal que P ( t n −1 ≤ t1−α ) = 1 − α . En nuestro caso t=1,8,
por lo que se RECHAZA la hipótesis nula.
Solución:
SUMA ni Pi nPi ni-nPi (ni-nPi)2 (ni-nPi)2/nPi
2 11 1/36 10 1 1 0.1
3 18 1/18 20 -2 4 0.2
4 33 1/12 30 3 9 0.3
5 41 1/9 40 1 1 0.025
6 47 5/36 50 -3 9 0.18
7 61 1/6 60 1 1 1/60
8 52 5/36 50 2 4 0.08
9 43 1/9 40 3 9 0.225
10 29 1/12 30 -1 1 1/30
11 17 1/18 20 -3 9 0.45
12 8 1/36 10 -2 4 0.4
360 1 360 2.01
D=∑
11
(n i − nPi )2 = 2.01 . Cuando la distribución está determinada no hay parámetros
i =1 nPi
que estimar y por tanto
utilizamos χ 11
2
− 0 −1 = χ 10 ;
2
siendo
p − valor =χ 2
P( 10 ≥ 2.01) =0.9962629352 y por tanto próximo a 1 y se acepta la
hipótesis nula “los dados no están trucados”. Podemos jugar con estos dados.
Nº cancelaciones Frecuencias
observadas ni
0 16
1 23
2 8
3 3
Sumas 50
Contrastar el hecho de que la distribución es de Poisson de parámetro λ=1.
Solución:
Datos: S=
2
100; σ
= 14; =
n 49; α
= 0, 05
H0: σ2 <142
H1: σ2 ≥ 142
S2 100
Aplicando el teorema de Fisher ( n − 1) ≡ χ 2n −1 ⇒ =
χ (49 − 1) = 24,49
σ 2
142
X −µ
a) Sabemos que el estadístico sigue una distribución t de Student con n-1
S
n
grados de libertad.
H 0 : µ <50
H1 : µ ≥ 50
Así pues:
53 − 50
=t = 2,598
4
12
b) H0: σ2 =10
H1: σ2 ≠ 10
S2 16
Aplicando el teorema de Fisher ( n − 1) ≡ χ 2n −1 ⇒ (12 − 1) =17, 6
σ 2
10
α
P ( χ 2n -1 < k1 ) = ⇒ P ( χ11
2
< k1 ) =0, 05
Buscaremos los valores de k1 y k2 tales que: 2 ,
α
P ( χ n -1 < k 2 ) = 1- ⇒ P ( χ11 < k 2 ) = 0,95
2 2
2
obtenemos k1= 4,57481308 y k2=19,6751376 para n-1=11 y α =0,1 . -
1.5 - 1.6 6
1.6 - 1.7 21
1.7 - 1.8 35
1.8 - 1.9 24
1.9 - 2.0 11
2.0 - 2.1 3
más de 2.1 0
Contrastar la hipótesis,
La muestra obtenida sigue una distribución normal N( X = 1.772 , S = 0.1168)
a) Obtener el p-valor y dar su interpretación.
b) Para un nivel de significación α = 0.05 calcular el valor crítico.
c) ¿Se acepta el ajuste para un nivel de significación α = 0.05 ?
Solución:
Supuestamente hemos calculado la media y la desviación típica de la muestra
obtenida:
X=
∑ x i n i =1,772; σ =0,1168
n
Consideramos la población con distribución N(1.772,0.1168).
ni Pi=F(ei)-F(ei-1) nPi nPi>5 (ni-nPi)2/nPi
0 0,00993570 0,994
6 0,06049339 6,049 7,043 0,15443331
21 0,19837353 19,837 19,837 0,06814156
35 0,32592605 32,593 32,593 0,17781797
24 0,26870796 26,871 26,871 0,30670732
11 0,11109752 11,110 13,656 0,00864832
3 0,02297503 2,298
0 0,00249082 0,249
( n i − npi )
2
=D ∑ npi
≈ 0,71574848
c) y como D=
(n i − np i )
2
=0,716 < 5,99 SE ACEPTA EL AJUSTE.
np i
X 0
Sabemos que: Z N (0,1)
/ n
Por ser muy próxima a cero RECHAZAMOS la hipótesis nula, y la media no puede ser
menor que 10.
0 10
1 30
2 50
3 10
Se pide:
a) Calcular las respectivas frecuencias teóricas correspodientes a una distribución
Binomial de parámetros n=3 y p=0,53, es decir, pi=P(X=xi)
b) Hallar el valor del estadístico de contraste:
ni npi
2
D
i npi
c) Estudiar la Bondad del ajuste para un nivel de significiación α=0,05
Solución:
a) A partir de de la distribución Binomial B(3,0.53) calculamos las frecuencias teóricas:
n 3
P(X = k) = p k . q n k = 0,53k 1 0,53
3 k
k k
3
P(X = 0) = 0,530 1 0,53 0,103823
3 0
0
3
P(X = 1) = 0,531 1 0,53 0,351231
31
1
3
P(X = 2) = 0,532 1 0,53 0,396069
3 2
2
3
P(X = 3) = 0,533 1 0,53 0.148877
3 3
3
b)
ni np i 2
ni npi ni npi
2
ni n pi
np i
0 10 10,3823 -0,3823 0,14615329 0,01407716
1 30 35,1231 -5,1231 26,2461536 0,74726188
2 50 39,6069 10,3931 108,016528 2,72721489
3 10 14,8877 -4,8877 23,8896113 1,60465426
100 100 5,09320819
n i npi
2
D 5,09320819
i npi
a) (
P X ≥ 55 = ) (
1 − P X < 55 = )
1 − FX (55) ≈ 0,03039636175
(n − 1). S 2
b) Sabiendo que ≡ χ n2 −1 si la población de partida es N(µ, σ)
σ2
(9 − 1).S2
En nuestro caso 2
≡ χ92−1
8
S 10
2 2
P ( S2 > 102 ) = P > = P ( χ8 > 12,5 ) = 1 − P ( χ8 > 12,5 ) = 1 − Fχ82 (12,5 ) ≈ 0.13025
2 2
8 8
∑x i
=X = 265,3
i =1
n
σ
X ± z1−α /2
n
X −µ
=
Tenemos Z ≡ N(0,1)
σ n
50 50
⇒ Iα=0.05 = 265.3 − 1.96 , 265.3 + 1.96 = ( 255.5, 275.1)
10 10
=
Datos: =
n 10; =
X 5, 28; S 2, 6
X − µ0 5, 28 − 5
|t|= = =0,3405529787
S/ n 2, 6 / 10
Calcularemos el p-valor
p= 1 − P ( -0,3405529787 < t n −1 < 0,3405529787 ) =
2P ( 0,3405529787 < t n −1 ) =
0, 74 .
luego se ACEPTA la hipótesis nula para cualquier nivel de significación menor que
0,74
S2h
2
∈ Fα ,F α
Sm 2 ,n h −1,n m −1 1− 2 ,n h −1,n m −1
Datos:
= =
n h 250; =
X h 28,896; =
Sh 2, 66390361; =
n m 250; =
X m 22,368; Sm 2, 74255422
S2A 2.663903612
= = 0.94346669 ∈ ( F0.025,249,249 , F0.975,249,249 ) =
( 0.7795917,1.28272281)
S2B 2.742554222
0,78 < 0,94 < 1,28 y por tanto aceptamos la hipótesis de varianzas iguales.
Contrastamos ahora la diferencia de medias de dos poblaciones normales de varianzas
desconocidas pero iguales y muestras pequeñas.
H0 : µh > µm ⇔ µh − µm > 0
H1 : µ h ≤ µ m ⇔ µ h − µ m ≤ 0
xh − xm
El estadístico de prueba es: = t siendo
1 1
S +
nh nm
ni np i n i − np i (n i − np i )2 (n i − np i )2
Clases np i
< 40 16 20 -4 16 0,8
[ 40,50 ) 22 20 2 4
0,2
[50, 60 ) 20 20 0 0
0
[60, 70) 19 20 -1 1
0,05
70 < 23 20 3 9 0,45
sumas 100 100 1,5
( n i − npi )
2
5
D= ∑ =1,5.
i =1 npi
P − valor = P(χ 24 ≥ 1,5) = 0,82664147 próximo a 1
Frecuencias pi Frecuencias (n i − np i )2
observadas esperadas np i
ni np i
Cara 63 0,5 50 3,38
Cruz 37 0,5 50 3,38
Sumas 100 1 100 6,76
que D= ∑
2
(n i − np i )2 .=6,76. Se rechaza la hipótesis nula.
i =1 np i
D=∑
i npi
d) Calcular el p-valor e indicar la bondad del ajuste.
e) Estudiar la Bondad del ajuste para un nivel de significiación α=0,03.
Solución:
ni xi x i n i
(x i − x) 2 n i (n i − np i )2
Medida pi npi
np i
30-40 16 35 560 7123,36 0,126135851 12,61 0,9091631
40-50 22 45 990 2710,62 0,206094543 20,61 0,09382186
50-60 20 55 1100 24,2 0,277003816 27,7 2,14061588
60-70 19 65 1235 1504,99 0,229289852 22,93 0,67324935
70-80 23 75 1725 8215,83 0,161475938 16,15 2,9078927
Sumas 100 5610 19579 1 100 6,72474289
a) Tenemos que calcular la media y la desviación típica de la distribución
Normal. Para ello consideramos la muestra obtenida:
( )
2
x= =
∑ x i n i =56,1; S =∑ x i − x n i 14, 0629896
n n −1
b) Consideramos la población con distribución N (56.1, 14.0629896).
ni
(n i − np i )2
Medida pi npi
np i
30-40 16 0,126135851 12,61 0,9091631
40-50 22 0,206094543 20,61 0,09382186
50-60 20 0,277003816 27,7 2,14061588
60-70 19 0,229289852 22,93 0,67324935
70-80 23 0,161475938 16,15 2,9078927
Sumas 100 1 100 6,72474289
σ 2
0 8 10 -2 4 0,4
1 8 10 -2 4 0,4
2 12 10 2 4 0,4
3 11 10 1 1 0,1
4 10 10 0 0 0
5 8 10 -2 4 0,4
6 9 10 -1 1 0,1
7 8 10 -2 4 0,4
8 12 10 2 4 0,4
9 14 10 4 16 0.16
∑ 100 100 4,2
a) Para α = 0,1 ⇒ P(χ92 ≤ x 0.9 )= 0.9 ⇒ x 0.9= 14, 68 siendo D =4,2
aceptamos la hipótesis de ser el ajuste bueno, es decir, las cifras decimales son
aleatorias.
b) p-valor ⇒ P(χ92 ≥ D) = P(χ92 ≥ 4, 2) = 0,89776
Contrastar una hipótesis estadísticamente es tomar una decisión sobre si cierta propiedad de una
población es compatible con lo observado en una muestra de dicha población.
Llamamos hipótesis nula, H0 , a la hipótesis que vamos a contrastar, H0 representa la
hipótesis que mantendremos mientras los datos no nos indiquen su falsedad.
Llamamos hipótesis alternativa, H1 , a la hipótesis que se aceptará si H0 se rechaza.
Las fases en un contraste de hipótesis son:
1) Definir la hipótesis a contrastar que llamaremos H0 .
2) Definir una medida de discrepancia D que mida la diferencia entre los valores observados y los
esperados (de acuerdo con H0).
3) Calcular D. Si la discrepancia D es muy grande, rechazaremos H0 ; en caso contrario,
aceptamos H0 .
Nivel de significación
Aceptación <
dc >
Rechazo
Se define el nivel crítico o p valor como el mínimo nivel de significación para el que, con
los datos de una muestra concreta, se tendría que rechazar la hipótesis nula H0 .
p P(D D n ) .
Es decir la probabilidad de obtener una discrepancia mayor o igual que la observada en la
muestra. De esta forma, el valor de p no se fija a priori, sino que se determina en función de
la muestra.
D es el estadístico y Dn es valor del estadístico obtenido con la muestra. Como se evidencia
en la figura siguiente, cuanto menor sea el valor crítico, menor es la probabilidad de existir
discrepancia como la observada, y menor es la certidumbre de H0.
Esto es; cuanto más cercano a cero sea su valor con mayor confianza se rechazará H0. Puesto
que, p P(D D n ) y Dn un valor fijo, si p es grande Dn es un valor pequeño, por tanto,
para un valor fijo de < p será Dn < dc y aceptamos la hipótesis H0,
En general cuanto más próximo a 1 sea p con mayor evidencia se habrá de aceptar H0 .
Si p>0.25 no existe suficiente evidencia para rechazar H0.
Si 0.01<p<0.25 existe incertidumbre entre rechazar o no rechazar H0.
Si p<0.01 en general deberá ser rechazada la hipótesis H0,
Si se ha fijado de antemano un nivel de significación , se acepta H0, si p>, y se rechaza
H0 si p<
ETSITGC
Contraste de Hipótesis Madrid
H 0 : µ = µ0
Contraste bilateral (2 colas)
H1 : µ ≠ µ 0
H 0 : µ < µ0
Contraste unilateral (cola de la derecha)
H1 : µ ≥ µ 0
H 0 : µ = µ0
Contraste bilateral (2 colas)
H1 : µ ≠ µ 0
H 0 : µ < µ0
Contraste unilateral (cola de la derecha)
H1 : µ ≥ µ 0
1 2 0 z z1
1, 2 z
X X ( )
1 2 1 2 1 2 0 z z1 / 2
n1 n 2
2 2 N(0,1)
1 2
1 2 0 z z1
X
X 2 (1 2 )
1 2 0 t t1
1, 2 , 12 , 22 1
t n1 n 2 2
t
2
1
2
2
n1 1 S n 2 1 S
2
1
2
2
1 n1 1 n 2 1 2 0 t t1 / 2
n1 n 2 2
1 2 0 t t1
1, 2 , 12 , 22
t
X X ( )
1 2 1 2
t g.l.
s12 s 22
n1 n 2
2
g.l.
12 22 S n1 S n 2
2 2
s12 / n1 s22 / n 2
2 2
1 2
n1 1 n2 1
Unidad Docente de Matemáticas
ETSITGC
Contraste de Hipótesis Madrid
0
n 1 S 2 / 2
2 2n1 0 0
2
1 / 2
0 1
12 22 f F,n1 1,n2 1
S12 f F / 2,n1 1,n2 1
,
2
1
2
2
f 2 Fn1 1,n 2 1 2
1
2
2
2 2
H0 :σ ≥ σ 0
Contraste unilateral (cola de la izquierda)
H1 : σ < σ 0
H0 :σ = σ 0
Contraste bilateral (2 colas)
H1 : σ ≠ σ 0
H0 :σ < σ 0
Contraste unilateral (cola de la derecha)
H1 : σ ≥ σ 0
Es una distribución que se presenta cuando tenemos una población n grande y la probabilidad de
que ocurra un suceso determinado, tiene una probabilidad muy pequeña (ley de casos raros).
Una variable aleatoria tiene distribución de Poisson de parámetro , si toma los valores
k
enteros 0, 1, ..., n con probabilidad: P( k ) e si > 0
k!
Esperanza matemática: E =
Varianza: V E 2 E =
2
Distribución t de Student.
n
denomina t de Student con n grados de libertad.
n 1
n 1
1 2 x2 2
Función de densidad: f ( x) 1
n n n
2
n
Su media 0 (n>1) y su varianza 2 (n>2).
n2
La gráfica de la función de densidad para n=3 grados de libertad:
La función de densidad de la
variable aleatoria 2n es:
n
1
2
x -x
f (x) e 2
si x 0
2
n
2 n
2
La función de distribución de
una variable aleatoria 2n viene dada
por:
x
F(x) P( n2 x ) f ( x)dx
0
Una variable aleatoria continua X se dice que tiene una distribución normal o de
1 (x ) 2
1
Laplace-Gauss de media y desviación típica : f (x) e 2 2
es su
2
función de densidad.
2
La esperanza matemática o media es y la varianza es 2 . Se denota N( , ).
(n 1).S2
Se sabe que 2n 1 si la población de partida es N(, ) . Por tanto, para tomar el
2
1 n
2
La varianza muestral S2 i
n 1 i1
es un estimador insesgado de la varianza 2 , ya
que: E S2 = 2
Debe observarse que no hemos hecho ninguna hipótesis de cual sea la distribución de
probabilidad de la variable .
1 n
2
Por tanto, la desviación típica muestral será: S i
n 1 i 1
La esperanza matemática es el valor medio teórico que resulta de sustituir las fi (frecuencias
relativas) por las Pi (probabilidades), y que no es sino una media aritmética ponderada. Se
acostumbra a definirlo como esperanza matemática de ganancias, es decir, la ganancia que
teóricamente esperaba obtener un jugador frente a unas determinadas reglas de juego.
E = x P( X ) i i para una variable discreta y no finita siempre que la serie sea
i 1
convergente.
E =
t. f ( t ). dt cuando la variable es continua con función de densidad f(x) y
Un estimador se llama insesgado cuando E .
La media muestral 1
2 ... n
n
es un estimador insesgado, ya que E , consistente,
eficiente, puesto que V
2
n
, y suficiente.
Se dice que una variable continua sigue una distribución uniforme en el intervalo a, b cuando
0 si x a
1
su función de densidad es: f (x) si a x b
b-a
0 si b<x
Gráficamente:
1_
b-a
a b
0 si x a
x- a
La función de distribución, será: F(x) si a x b cuya gráfica es:
b - a
1 si b < x
a b
ab
Media: E x.f (x).dx
2
a b 2
V E E
2 2
Varianza:
12
Esta distribución depende de los parámetros a y b y se denota U a, b .
Para el caso discreto se caracteriza por tener todos su valores la misma probabilidad