Estadistica Tema 4
Estadistica Tema 4
Estadistica Tema 4
Estadística
Pruebas de hipótesis y modelos de regresión
Universidad de las Fuerzas Armadas ESPE Unidad de Educación a Distancia
Índice Pág.
Recursos complementarios 32
Bibliografía 33
Para tener resultados fiables, el nivel de confianza debe ser alto (muy cercano
a 1) por lo que normalmente toma valores de 0,90; 0,95; 0,99. (90%, 95%, 99%
expresados como porcentajes)
Por ejemplo:
La directora de un centro de cuidado infantil de la ciudad de Quito ha
determinado que los gastos medios en medicina preventiva para los niños de
su centro están en un intervalo de 35 a 38 dólares calculado a un nivel de
confianza del 95%.
𝜎𝜎 𝜎𝜎
�𝑥𝑥̅ − 𝑧𝑧𝛼𝛼� ; 𝑥𝑥̅ + 𝑧𝑧𝛼𝛼�2 �
2
√𝑛𝑛 √𝑛𝑛
donde:
n es el tamaño de la muestra
σ es la desviación estándar de la población
𝑧𝑧𝛼𝛼�2 es el valor z que corresponde al área de α/2 en el extremo superior de la
Ejemplo:
Datos:
n = 600
σ =1,90 días
Nivel de confianza = 90% (0,90), es decir que α = 1- 0,90 = 0,10. Por lo tanto
α/2 = 0,05
1,90 1,90
�7,2 − 1,645 × ; 7,2 + 1,645 × �
√600 √600
(7,2 − 0.128; 7,2 + 0,128)
(7,072 ; 7,328)
Distribución T de Student:
Cuando hay que tomar una muestra pequeña, la distribución normal no siempre
es la adecuada. En concreto, cuando la muestra es pequeña y la desviación
estándar es desconocida, no se deberá aplicar la distribución z recurriéndose a
una distribución alternativa llamada T de Student.
Ejemplo:
Con estos dos datos entrando a la tabla se obtiene que el valor t buscado es de
= 1,895.
Intervalo de confianza:
Para construir un intervalo de confianza para la media en muestras pequeñas,
debemos basar nuestra ecuación en la distribución t, por lo tanto, quedará
establecida de la siguiente manera:
𝑠𝑠 𝑠𝑠
�𝑥𝑥̅ − 𝑡𝑡𝛼𝛼� ; 𝑥𝑥̅ + 𝑡𝑡𝛼𝛼�2(𝑛𝑛−1) �
2(𝑛𝑛−1)
√𝑛𝑛 √𝑛𝑛
donde:
n es el tamaño de la muestra
s es la desviación estándar muestral
𝑡𝑡𝛼𝛼�2(𝑛𝑛−1) es el valor de la distribución t de Student a (n-1) grados de libertad,
Ejemplo:
𝑥𝑥̅ = 164,5 cm
n = 16, es decir n-1 = 16 -1 = 15
s = 8,3 cm
Nivel de confianza = 95% (0,95), es decir que α = 1- 0,95 = 0,05. Por lo tanto, α/2 =
0,025
𝑡𝑡𝛼𝛼�2(𝑛𝑛−1) (el valor t a 15 grados de libertad y un nivel de significancia 0,025) =
2,131
𝑠𝑠 𝑠𝑠
�𝑥𝑥̅ − 𝑡𝑡𝛼𝛼� ; 𝑥𝑥̅ + 𝑡𝑡𝛼𝛼�2(𝑛𝑛−1) �
2(𝑛𝑛−1)
√𝑛𝑛 √𝑛𝑛
8,3 8,3
�164,5 − 2,131 × ; 164,5 + 2,131 �
√16 √16
(164,5 − 4,422; 164,5 + 4,422)
(160,078 ; 168,922)
𝑥𝑥̅ − 𝜇𝜇 𝑥𝑥̅ − 𝜇𝜇
𝑧𝑧 = =
𝜎𝜎𝑥𝑥 𝜎𝜎/√𝑛𝑛
despejando n se tiene:
𝑧𝑧 2 𝜎𝜎 2
𝑛𝑛 =
(𝑥𝑥̅ − 𝜇𝜇 )2
Ejemplo:
Datos:
σ = 4 km
Entonces:
𝑧𝑧 2 𝜎𝜎 2
𝑛𝑛 =
(𝑥𝑥̅ − 𝜇𝜇 )2
(1,96)2 (4)2
𝑛𝑛 = = 1536,64
(0,2)2
𝑥𝑥̅ − 𝜇𝜇 𝑥𝑥̅ − 𝜇𝜇
𝑧𝑧 = 𝜎𝜎 (𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔𝑔) ; 𝑡𝑡 = 𝑠𝑠 (𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝ñ𝑎𝑎)
√𝑛𝑛 √𝑛𝑛
INICIO
Use la distribución normal con:
SI
� − 𝝁𝝁
𝒙𝒙
𝒛𝒛 = 𝝈𝝈
¿Es n ≥ 30?
√𝒏𝒏
USE MÉTODOS NO
¿Es la distribución
PARAMÉTRICOS QUE
NO NO REQUIEREN DE
poblacional
normal? UNADISTRIBUCIÓN
NORMAL
SI
� − 𝝁𝝁
𝒙𝒙
𝒕𝒕 = 𝒔𝒔
√𝒏𝒏
Una regla de decisión establece las condiciones con las cuales se rechaza
la hipótesis nula y las condiciones con las cuales no se rechaza la
hipótesis nula. La región crítica, es el conjunto de todos los valores de la
estadística de prueba que harían rechazar la hipótesis nula. El valor
Zcal ≤ zcrit
Cola Derecha o
tcal ≤ tcrit
Paso 5: Conclusión
𝑋𝑋� − 𝜇𝜇
𝑧𝑧 =
𝜎𝜎 ⁄√𝑛𝑛
𝑋𝑋� − 𝜇𝜇
𝑧𝑧 =
𝑠𝑠⁄√𝑛𝑛
1) Planteamiento de Hipótesis
2100.
2) Nivel de Significancia
2.5% 2.5%
Z crítico Z crítico
-1.96 Z cal
1.96
1.487
4) Reglas de Decisión
5) Conclusión
promedio de la industria?
1) Planteamiento de Hipótesis
𝐻𝐻𝐻𝐻 = 𝑢𝑢 > 144 Las comisiones de los clientes son mayores que el
promedio de la industria.
2) Nivel de Significancia
Es una prueba de cola derecha. Se ubica el área de bajo la curva en la
tabla de la distribución de la normal y se obtiene z crítico= 1.28
10%
Z crítico Z cal
1.28 1.481
4) Reglas de Decisión
Si Zcal < 1.28, se rechaza la hipótesis nula por ser mayor y se acepta la
hipótesis alternativa
5) Conclusión
∑(𝑥𝑥 − 𝑥𝑥̅ )2
s=�
𝑛𝑛 − 1
∑ 𝑥𝑥 ∑(𝑥𝑥− 𝑥𝑥̅ )2
𝑥𝑥̅ = = 4.57 s = � = 0.000578 → 𝑠𝑠 = 0.2405
𝑛𝑛 𝑛𝑛−1
1) Planteamiento de Hipótesis
𝐻𝐻0 : 𝜇𝜇 ≤ 4.50%; 𝐿𝐿𝐿𝐿 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑜𝑜 𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖𝑖 𝑎𝑎 4.50%
𝐻𝐻1 : 𝜇𝜇 > 4.50%; 𝐿𝐿𝐿𝐿 𝑡𝑡𝑡𝑡𝑡𝑡𝑡𝑡 𝑑𝑑𝑑𝑑 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑒𝑒𝑒𝑒 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑎𝑎 4.50%
2) Nivel de Significancia
5%
0
t crítico
t calculado 1.796
1.032
4) Reglas de Decisión
5) Conclusión
Diagrama de Dispersión
21
19
Notas de Examen Final
17
15
13
11
9
80 85 90 95 100 105 110 115 120 125
Cantidad de Alumnos
𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑:
∑ 𝑥𝑥
𝑋𝑋�: 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑋𝑋, 𝑥𝑥� =
𝑛𝑛
∑ 𝑦𝑦
𝑌𝑌�: 𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚𝑚 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑑𝑑𝑑𝑑 𝑌𝑌, 𝑦𝑦
�=
𝑛𝑛
𝑆𝑆𝑋𝑋 𝑦𝑦 𝑆𝑆𝑦𝑦 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟𝑟 𝑙𝑙𝑙𝑙𝑙𝑙 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑒𝑒𝑒𝑒𝑡𝑡á𝑛𝑛𝑛𝑛𝑛𝑛𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙𝑙𝑙 𝑥𝑥 𝑦𝑦 𝑙𝑙𝑙𝑙𝑙𝑙 𝑦𝑦
�)2
∑(𝑥𝑥− 𝑥𝑥
𝑆𝑆𝑥𝑥 =� 𝑛𝑛−1
∑(𝑦𝑦 − 𝑦𝑦�)2
𝑆𝑆𝑦𝑦 = �
𝑛𝑛 − 1
Ejemplo:
𝑋𝑋� = 6.71
𝑌𝑌� = 34.37
Sx = 2.02
Sy = 2.99
2122.69
𝑟𝑟 = = 0.97
(8)2.02 ∗ 2.99
𝑌𝑌 = 𝑎𝑎 + 𝑏𝑏𝑏𝑏 , 𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑𝑑 𝑌𝑌 𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒𝑒ó𝑛𝑛 𝑑𝑑𝑑𝑑 𝑙𝑙𝑙𝑙 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑌𝑌 𝑝𝑝𝑝𝑝𝑝𝑝𝑝𝑝 𝑢𝑢𝑢𝑢 𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣𝑣 𝑋𝑋 𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠𝑠
𝑏𝑏 = 𝑟𝑟 𝑆𝑆𝑦𝑦 /𝑆𝑆𝑥𝑥
𝑎𝑎 = 𝑌𝑌� − 𝑏𝑏𝑋𝑋�
𝑋𝑋� = 6.71
𝑌𝑌� = 34.37
Sx = 2.02
Sy = 2.99
Entonces:
Diagrama de Dispersión
40
38
Notas de Examen Final
36
34
32
30
28
2 3 4 5 6 7 8 9 10
Cantidad de Alumnos
Podemos ver en el gráfico que las variables tienen una correlación positiva alta,
ya que se puede ver que la recta de regresión esta muy cerca de casi todos los
puntos.
Recursos complementarios
modelos de regresión
https://www.youtube.com/watch?v=2WlPJYMUxls&feature=youtu.be
https://www.youtube.com/watch?v=AJcy4eZMwWM
https://www.youtube.com/watch?v=SsFBnvkoZa4
Bibliografía