Estadistica
Estadistica
Estadistica
• Dispersión
• Varianza
• Covarianza
• Poblacional • Muestral
La distribución normal
Por ejemplo: para una muestra aleatoria y1,y2, ...,yn de una distribución NID(0, 1), SS/σ2
sigue una distribución χ2 con n - 1 grados de libertad.:
La distribución t
Si z y χ2k son variables aleatorias independientes normal estándar y ji-cuadrada,
respectivamente, la variable aleatoria definida como:
sigue una distribución t con k grados de libertad, con µ = 0 y σ2 = k/(k - 2) para k > 2 :
Se puede demostrar que si y1,y2, ...,yn, es una muestra aleatoria de una distribución N(µ, σ2),
entonces la siguiente cantidad es una distribución t con n-1 grados de libertad
La distribución F
Si χ2u y χ2v son dos variables aleatorias ji-cuadrada independientes con u y v grados de
libertad, respectivamente, entonces el cociente definido como:
Si y11,y12, ...,y1n1 es una muestra aleatoria de n1, observaciones de una población y si y21,y22,
...,y2n2 lo es de n2 observaciones de otra, entonces:
¿Y ahora qué hago yo con
todas estas funciones?
Prueba de hipótesis
Recuperemos el ejemplo de la formulación de cemento:
y11,y12, ...,y1n1 representan las n1, observaciones del primer nivel del factor y y21,y22, ...,y2n2
las n2 observaciones del segundo nivel del factor. Y supongamos que las muestras se sacan
al azar de dos poblaciones normales independientes:
Hipótesis nula:
Hipótesis alternativa:
Falso negativo
Falso positivo
Verdadero negativo
La prueba t Queremos comprobar la hipótesis nula H0: µ1 = µ2
Definimos el estadístico de prueba “t”:
Donde Sp es un estimador de la varianza común:
|-9.13|> 2.093
Se rechaza la hipótesis nula,
con una probabilidad mayor
al 95%
La prueba t: ¿en realidad qué estamos haciendo?
Nota: En el caso más sencillo (comparación de una muestra poblacional con un valor esperado), la prueba
consiste en ver si el valor esperado está dentro de una distribución normal. o no. La distribución t se construye
para casos en los que la prueba normal no es aplicable directamente.
Validez de una prueba t con muestras reales
=1
Intervalos de confianza
A menudo el problema no es saber si dos promedios son diferentes sino dentro de qué intervalo
de confianza se encuentra esa diferencia
El objetivo es encontrar el intervalo [L, U] dentro del cual se encuentra el valor verdadero de µ1-µ2
con una confianza de 100 (1 – α) %
Donde podemos identificar los límites superior e inferior para una confianza de 1 – α
Intervalo de confianza Aplicado al ejemplo escogido
Partimos de la inecuación anterior:
Nuestro objetivo es averiguar los limites de confianza de la diferencia µ1-µ2 para un nivel de confianza
propuesto. En nuestro caso, supongamos que queremos una confianza superior al 95%:
α = 0.05
ȳ1-ȳ2 = 16.76 – 17.92 = -1.16 (*)
Sp = 0.284
n1 = n2 = 10
tα/2, n1 + n2 – 2 = 2.101 (extraído de la tabla)
Sustituyendo estos datos arriba, obtenemos los siguientes límites con un 95% de confianza:
Es decir: nosotros lo que hemos medido es una diferencia en la fuerza de adhesión promedio de -
1.16Kgf/cm2 con el cambio de formulación; pero lo único que podemos afirmar es que con un 95% de
confianza la diferencia de fuerzas promedio estará comprendida en el intervalo [-1.43, -0.89] Kgf/cm2.
(*) Nótese que se han tratado las variables dimensionales deliberadamente como adimensionales.
Jugando con los estadisticos de prueba en MatLab
Problema del cemento Portland:
16.8500 17.5000 h=
16.4000 17.6300 1 Se rechaza la hipótesis nula
17.2100 18.2500
16.3500 18.0000 p=
16.5200 17.8600 2.9576e-006 Con probabilidad 1- 2.9576e-006 ≈ 1
17.0400 17.7500
16.9600 18.2200 ci = Intervalo de confianza para la
17.1500 17.9000 -1.4140 diferencia entre las medias
16.5900 17.9600 -0.9020
16.5700 18.1500
stats = Estadísticos importantes:
tstat: -10.2311 Valor de tα/2, n1 + n2 - 2
df: 9 Grados de libertad
sd: 0.3579 Desviación estándar común
mean (y)
16.7640 17.9220
Se rechaza la hipótesis nula, por lo tanto la diferencia entre las
std(y) fuerzas de adhesión es significativa
0.3164 0.2479
Problema control de calidad textil
Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la
resistencia a la ruptura promedio excede 200 psi. De ser así, el fabricante aceptará el lote.
La experiencia pasada indica que un valor razonable para la varianza de la resistencia a la
ruptura es 100(psi)2. Las hipótesis que deberán probarse son:
H0:µ=200psi
H1: µ>200psi
Si se especifica un error tipo I de α = 0.05, en las tablas de valores de Z se encuentra que Zα = Z0.05 =
1.645.
Por lo tanto, H0 se rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200
psi.
Jugando con los estadísticos de prueba en MatLab
Resolución automática:
Hipótesis:
Estadístico de prueba:
Se rechaza la hipótesis nula si |Z0| > Zα/2, donde Zα/2 se extrae de la tabla de la distribución normal
Intervalo de confianza:
Resumen: Comparación de una muestra con un valor fijo
Hipótesis:
Estadístico de prueba:
Se rechaza la hipótesis nula si |Z0| > Zα/2, donde Zα/2 se extrae de la tabla de la distribución Z
Intervalo de confianza:
Tablas resumen
Prueba para comparar distribuciones de Prueba para comparar distribuciones de
varianza conocida. varianza desconocida.
Ejercicios propuestos:
1- Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia
pasada indica que la desviación estándar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra
aleatoria de cuatro ejemplares de prueba, y los resultados son y1 = 145, y2 = 153, y3 = 150 y y4 = 147.
a) Enunciar las hipótesis que considere que deberían probarse en este experimento.
b) Probar estas hipótesis utilizando α = 0.05. ¿A que conclusiones se llega?
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio.
2- Los diámetros de las flechas de acero producidas en cierto proceso de manufactura deberán tener un
promedio de 0.255 pulgadas. Se sabe que el diámetro tiene una desviación estándar de 0 = 0.0001
pulgadas, Una muestra aleatoria de 10 flechas tiene un diámetro promedio de 0.2545 pulgadas.
a) Establecer las hipótesis apropiadas para la media µ.
b) Probar estas hipótesis utilizando α = 0.05. ¿A que conclusiones se llega?
c) Encontrar el valor P para esta prueba.
d) Construir un intervalo de confianza de 95% para el diámetro promedio de las flechas.
3- La vida de anaquel de una bebida carbonatada es motivo de interés. Se seleccionan 10 botellas al azar y
se prueban, obteniéndose los siguientes resultados:
Días: 108,138,124, 163,124,159,106,134,115, 139
a) Quiere demostrarse que la vida media de anaquel excede los 120 días. Establecer las hipótesis
apropiadas para investigar esta afirmación.
b) Probar estas hipótesis utilizando α = 0.01. ¿A qué conclusiones se llega?
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 99% para la vida media de anaquel.