Estadistica

Unidad 1:
• Nociones básicas de estadística

Ejemplo: mejora en la formulación del cemento Portland
Objetivo: juzgar si un cambio en la formulación determina una mejora en la resistencia del
material
Metodología: se elaboran 10 muestras de cada una de las dos formulaciones a comparar y se

hacen mediciones de su fuerza de tensión de adhesión (kgf)
y1. = 16.76 kgf/cm2; y2. = 17.92kgf/cm2

Resumen estadística
• Media
• Dispersión
• Varianza
• Covarianza
• Si y1, y2 son independientes:

Parámetros y estimadores
• Poblacional • Muestral
La distribución normal
Distribución normal estándar:

Se puede estandarizar cualquier función normal:
; =>
El teorema del límite central:

Si y1,y2, ...,yn, es una sucesión de n variables aleatorias independientes que tienen una
distribución idéntica con E(yi) = µ y V(yi) = σ2 (ambas finitas) y x = y1 + y2 +…+ yn,
entonces x se aproxima bien a una distribución normal y se puede definir una función zn
que se aproxima bien a una normal estándar:
En consecuencia, la distribución normal es una buena forma de modelar el error

experimental combinado
La distribución χ2
Si z1, z2, ..., zk, son variables aleatorias que tienen una distribución normal e independiente
con media 0 y varianza 1, ( z1, z2, ..., zk ~ NID(0, 1) ),
entonces la variable aleatoria x = z12+z22 +…+zk2 sigue la distribución χ2 con k grados de

libertad:
Por ejemplo: para una muestra aleatoria y1,y2, ...,yn de una distribución NID(0, 1), SS/σ2
sigue una distribución χ2 con n - 1 grados de libertad.:
La distribución t
Si z y χ2k son variables aleatorias independientes normal estándar y ji-cuadrada,
respectivamente, la variable aleatoria definida como:
sigue una distribución t con k grados de libertad, con µ = 0 y σ2 = k/(k - 2) para k > 2 :
Se puede demostrar que si y1,y2, ...,yn, es una muestra aleatoria de una distribución N(µ, σ2),
entonces la siguiente cantidad es una distribución t con n-1 grados de libertad
La distribución F
Si χ2u y χ2v son dos variables aleatorias ji-cuadrada independientes con u y v grados de
libertad, respectivamente, entonces el cociente definido como:
sigue la distribución F con u grados de libertad en el numerador y v grados de libertad en el

denominador.
Y si x es una variable aleatoria F con u grados de libertad en el numerador y v grados de

libertad en el denominador, entonces la distribución de probabilidad de x es:
Si y11,y12, ...,y1n1 es una muestra aleatoria de n1, observaciones de una población y si y21,y22,
...,y2n2 lo es de n2 observaciones de otra, entonces:
¿Y ahora qué hago yo con
todas estas funciones?
Prueba de hipótesis
Recuperemos el ejemplo de la formulación de cemento:
y11,y12, ...,y1n1 representan las n1, observaciones del primer nivel del factor y y21,y22, ...,y2n2
las n2 observaciones del segundo nivel del factor. Y supongamos que las muestras se sacan
al azar de dos poblaciones normales independientes:
Hipótesis nula:
Hipótesis alternativa:
Falso negativo
Falso positivo
Verdadero negativo
La prueba t Queremos comprobar la hipótesis nula H0: µ1 = µ2
Definimos el estadístico de prueba “t”:
Donde Sp es un estimador de la varianza común:
H0 se rechaza si, al compararse t0 con la distribución t con n1 + n2 - 2 grados de libertad resulta:

|t0| > tα/2, n1 + n2 – 2
donde tα/2, n1 + n2 - 2 es el punto porcentual α/2 superior de la distribución t con n1 + n2 - 2 grados de libertad
Datos del ejemplo:
Se impone una probabilidad de falso rechazo por ejemplo

inferior al 5% (α<0.05)
|-9.13|> 2.093
Se rechaza la hipótesis nula,
con una probabilidad mayor
al 95%
La prueba t: ¿en realidad qué estamos haciendo?
•Construimos un estadístico de prueba t0

•Postulamos una hipótesis
•Su cumplimiento depende de que t0 se encuentre dentro de una distribución t
•Se comprueba la hipótesis
Nota: En el caso más sencillo (comparación de una muestra poblacional con un valor esperado), la prueba
consiste en ver si el valor esperado está dentro de una distribución normal. o no. La distribución t se construye
para casos en los que la prueba normal no es aplicable directamente.
Validez de una prueba t con muestras reales
•Hipótesis de normalidad de las

muestras a comparar
•Tamaño de las muestras: curvas de

operación
Datos del ejemplo:
Diferencia a detectar: µ1-µ2 = 0.5Kgf/cm2

σ = 0.025 Kgf/cm2 (estimada)
β = 0.05 (requerida para una confianza del 95%)
=1
Intervalos de confianza
A menudo el problema no es saber si dos promedios son diferentes sino dentro de qué intervalo
de confianza se encuentra esa diferencia
P(L< (µ1-µ2) < U) = 1 – α
El objetivo es encontrar el intervalo [L, U] dentro del cual se encuentra el valor verdadero de µ1-µ2
con una confianza de 100 (1 – α) %
Cambiando en la prueba t la variable de interés por µ1-µ2:
se distribuye como una variable tn1 + n2 - 2 y por tanto cumple la desigualdad:
Donde podemos identificar los límites superior e inferior para una confianza de 1 – α
Intervalo de confianza Aplicado al ejemplo escogido
Partimos de la inecuación anterior:
Nuestro objetivo es averiguar los limites de confianza de la diferencia µ1-µ2 para un nivel de confianza
propuesto. En nuestro caso, supongamos que queremos una confianza superior al 95%:
α = 0.05
ȳ1-ȳ2 = 16.76 – 17.92 = -1.16 (*)
Sp = 0.284
n1 = n2 = 10
tα/2, n1 + n2 – 2 = 2.101 (extraído de la tabla)
Sustituyendo estos datos arriba, obtenemos los siguientes límites con un 95% de confianza:
-1.43 < µ1 - µ2 < -0.89
Es decir: nosotros lo que hemos medido es una diferencia en la fuerza de adhesión promedio de -
1.16Kgf/cm2 con el cambio de formulación; pero lo único que podemos afirmar es que con un 95% de
confianza la diferencia de fuerzas promedio estará comprendida en el intervalo [-1.43, -0.89] Kgf/cm2.
(*) Nótese que se han tratado las variables dimensionales deliberadamente como adimensionales.
Jugando con los estadisticos de prueba en MatLab
Problema del cemento Portland:
y= [h,p,ci,stats] = ttest(y(:,1),y(:,2), 0.05) Interpretación:
16.8500 17.5000 h=
16.4000 17.6300 1 Se rechaza la hipótesis nula
17.2100 18.2500
16.3500 18.0000 p=
16.5200 17.8600 2.9576e-006 Con probabilidad 1- 2.9576e-006 ≈ 1
17.0400 17.7500
16.9600 18.2200 ci = Intervalo de confianza para la
17.1500 17.9000 -1.4140 diferencia entre las medias
16.5900 17.9600 -0.9020
16.5700 18.1500
stats = Estadísticos importantes:
tstat: -10.2311 Valor de tα/2, n1 + n2 - 2
df: 9 Grados de libertad
sd: 0.3579 Desviación estándar común
mean (y)
16.7640 17.9220
Se rechaza la hipótesis nula, por lo tanto la diferencia entre las
std(y) fuerzas de adhesión es significativa
0.3164 0.2479
Problema control de calidad textil
Un proveedor ofrece lotes de tela a un fabricante de textiles. El fabricante desea saber si la
resistencia a la ruptura promedio excede 200 psi. De ser así, el fabricante aceptará el lote.
La experiencia pasada indica que un valor razonable para la varianza de la resistencia a la
ruptura es 100(psi)2. Las hipótesis que deberán probarse son:
H0:µ=200psi
H1: µ>200psi
Se seleccionan cuatro ejemplares aleatoriamente cuyas resistencias son:
216psi, ,219psi, 210psi, 210psi, 215psi, 214psi

Resolución manual:
y. = 214 psi
Si se especifica un error tipo I de α = 0.05, en las tablas de valores de Z se encuentra que Zα = Z0.05 =
1.645.
Por lo tanto, H0 se rechaza y se concluye que la resistencia a la ruptura promedio del lote excede 200
psi.
Jugando con los estadísticos de prueba en MatLab
Resolución automática:
[H,P,CI, ZVAL] = ztest(textil,200,3.5, 0.05) Interpretación:

textil =
[216 H= Se rechaza la hipótesis nula

219 1
210
210 P= Con probabilidad 1 - 1.15e-022 ≈ 1
215 1.1488e-022
214]
CI =
mean (y) 211.1995 Intervalo de confianza para el
214 216.8005 promedio
std(y) ZVAL = Valor de Z utilizado en la

3.5214 9.7980 comparación
Se rechaza la hipótesis nula, por lo tanto la resistencia a la ruptura

esperable del producto supera el límite pedido (200psi)
La prueba t simplificada, con σ1 y σ2 conocidos
Hipótesis:
Estadístico de prueba:
Se rechaza la hipótesis nula si |Z0| > Zα/2, donde Zα/2 se extrae de la tabla de la distribución normal
Intervalo de confianza:
Resumen: Comparación de una muestra con un valor fijo
Hipótesis:
Estadístico de prueba:
Se rechaza la hipótesis nula si |Z0| > Zα/2, donde Zα/2 se extrae de la tabla de la distribución Z
Intervalo de confianza:
Tablas resumen
Prueba para comparar distribuciones de Prueba para comparar distribuciones de
varianza conocida. varianza desconocida.
Ejercicios propuestos:
1- Se requiere que la resistencia a la ruptura de una fibra sea de por lo menos 150 psi. La experiencia
pasada indica que la desviación estándar de la resistencia a la ruptura es a = 3 psi. Se prueba una muestra
aleatoria de cuatro ejemplares de prueba, y los resultados son y1 = 145, y2 = 153, y3 = 150 y y4 = 147.
a) Enunciar las hipótesis que considere que deberían probarse en este experimento.
b) Probar estas hipótesis utilizando α = 0.05. ¿A que conclusiones se llega?
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 95% para la resistencia a la ruptura promedio.
2- Los diámetros de las flechas de acero producidas en cierto proceso de manufactura deberán tener un
promedio de 0.255 pulgadas. Se sabe que el diámetro tiene una desviación estándar de 0 = 0.0001
pulgadas, Una muestra aleatoria de 10 flechas tiene un diámetro promedio de 0.2545 pulgadas.
a) Establecer las hipótesis apropiadas para la media µ.
b) Probar estas hipótesis utilizando α = 0.05. ¿A que conclusiones se llega?
c) Encontrar el valor P para esta prueba.
d) Construir un intervalo de confianza de 95% para el diámetro promedio de las flechas.
3- La vida de anaquel de una bebida carbonatada es motivo de interés. Se seleccionan 10 botellas al azar y
se prueban, obteniéndose los siguientes resultados:
Días: 108,138,124, 163,124,159,106,134,115, 139
a) Quiere demostrarse que la vida media de anaquel excede los 120 días. Establecer las hipótesis
apropiadas para investigar esta afirmación.
b) Probar estas hipótesis utilizando α = 0.01. ¿A qué conclusiones se llega?
c) Encontrar el valor P para la prueba.
d) Construir un intervalo de confianza de 99% para la vida media de anaquel.

Estadistica

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

Estadistica

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Estadistica

Cargado por

Copyright:

Formatos disponibles

Unidad 1:

• Nociones básicas de estadística

Metodología: se elaboran 10 muestras de cada una de las dos formulaciones a comparar y se

y1. = 16.76 kgf/cm2; y2. = 17.92kgf/cm2

• Si y1, y2 son independientes:

Distribución normal estándar:

El teorema del límite central:

En consecuencia, la distribución normal es una buena forma de modelar el error

entonces la variable aleatoria x = z12+z22 +…+zk2 sigue la distribución χ2 con k grados de

sigue la distribución F con u grados de libertad en el numerador y v grados de libertad en el

Y si x es una variable aleatoria F con u grados de libertad en el numerador y v grados de

H0 se rechaza si, al compararse t0 con la distribución t con n1 + n2 - 2 grados de libertad resulta:

Se impone una probabilidad de falso rechazo por ejemplo

•Construimos un estadístico de prueba t0

•Hipótesis de normalidad de las

•Tamaño de las muestras: curvas de

Diferencia a detectar: µ1-µ2 = 0.5Kgf/cm2

P(L< (µ1-µ2) < U) = 1 – α

Cambiando en la prueba t la variable de interés por µ1-µ2:

se distribuye como una variable tn1 + n2 - 2 y por tanto cumple la desigualdad:

-1.43 < µ1 - µ2 < -0.89

y= [h,p,ci,stats] = ttest(y(:,1),y(:,2), 0.05) Interpretación:

Se seleccionan cuatro ejemplares aleatoriamente cuyas resistencias son:

216psi, ,219psi, 210psi, 210psi, 215psi, 214psi

[H,P,CI, ZVAL] = ztest(textil,200,3.5, 0.05) Interpretación:

[216 H= Se rechaza la hipótesis nula

std(y) ZVAL = Valor de Z utilizado en la

Se rechaza la hipótesis nula, por lo tanto la resistencia a la ruptura

También podría gustarte