Inferencia Estadística PDF
Inferencia Estadística PDF
Inferencia Estadística PDF
inferencia estadística
Semanas 10 y 11
Probabilística
(Muestreo Aleatorio Simple)
Muestra
Población
Generalizo
comportamiento
• Media (x)
• Proporción (p)
Muestra
• Varianza (s2)
PARÁMETROS
• Desviación
• MEDIA (µ) estándar (s)
Población
• PROPORCIÓN (π)
Estimadores
• VARIANZA (σ2)
• DESVIACIÓN
ESTÁNDAR (σ)
a los v alores
Aproxim
El estimador es una
variable aleatoria. Se
: podría calcular el
: valor de la media y la
desviación estándar
para el estimador.
Muestra
s
À En la práctica no tiene sentido tomar TODAS las muestras posibles, sería un proceso ineficiente.
À En la práctica se toma UNA ÚNICA muestra y con ella de concluye sobre la POBLACIÓN
Una estimación es un valor que toma el estimador en una muestra específica y se utiliza para
aproximar el verdadero valor del parámetro.
El error estándar describe la falta de fiabilidad (debida al error de muestreo)del estimador con
respecto al parámetro.
distribución
muestral Cuantitativa
¿Qué tipo
de variable
se tiene? Cualitativa
Proporción
Dispersión ¿Cuál es
el interés?
Tendencia NORMAL
Varianza
Media
JI-
CUADRADO No ¿Se conoce la Si
varianza de la
población?
T-STUDENT NORMAL
Muestra
6
cuando 8 5
4
construimos 6un
7
3
Muestra
intervalo de 5 1
x
confianza? 3 4 µ
21. Pesos de mujeres Si utilizamos la muestra aleatoria simple de los pesos de mujeres incluidos
en el conjunto de datos 1 del apéndice B, obtenemos los siguientes estadísticos muestrales: n 5 40
y x = 146.22 libras. Investigaciones de otras fuentes sugieren que la población de pesos de mujeres
tiene una desviación estándar dada por s 5 30.86 libras.
a) Calcule la mejor estimación puntual de la media del peso de todas las mujeres.
b) Calcule una estimación de un intervalo de confianza del 95% del peso medio de todas las
mujeres.
Mejor estimación
puntual para µ
n = 40
σ = 30.86
x = 146.22
Confianza 95% à Z0.025 = 1.96
Ejemplo
26. Pesos al nacer Una muestra aleatoria simple de pesos al nacer en Estados Unidos tiene una
media de 3433 g. La desviación estándar de todos los pesos al nacer es de 495 g.
a) Utilice un tamaño de la muestra de 75 para construir un intervalo de confianza del 95% para
el peso medio al nacer en Estados Unidos.
b) Utilice un tamaño de la muestra de 75,000 para construir un intervalo de confianza del 95%
para el peso medio al nacer en Estados Unidos.
c) ¿Cuál de los intervalos de confianza anteriores es más ancho? ¿Por qué?
Distribución t-Student
α
v 0.40 0.30 0.20 0.15 0.10 0.05 0.025
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571
amplitud. 18
19
0.257
0.257
0.534
0.533
0.862
0.861
1.067
1.066
1.330
1.328
1.734
1.729
2.101
2.093
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074
23 0.256 0.532 0.858 1.060 1.319 1.714 2.069
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064
25 0.256 0.531 0.856 1.058 1.316 1.708 2.060
26 0.256 0.531 0.856 1.058 1.315 1.706 2.056
27 0.256 0.531 0.855 1.057 1.314 1.703 2.052
Grados de libertad 28
29
0.256
0.256
0.530
0.530
0.855
0.854
1.056
1.055
1.313
1.311
1.701
1.699
2.048
2.045
30 0.256 0.530 0.854 1.055 1.310 1.697 2.042
40 0.255 0.529 0.851 1.050 1.303 1.684 2.021
60 0.254 0.527 0.848 1.045 1.296 1.671 2.000
120 0.254 0.526 0.845 1.041 1.289 1.658 1.980
∞ 0.253 0.524 0.842 1.036 1.282 1.645 1.960
0.05 0.025
Ejemplo
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571
6 0.265 0.553 0.906 1.134 1.440 1.943 2.447
7 0.263 0.549 0.896 1.119 1.415 1.895 2.365
8 0.262 0.546 0.889 1.108 1.397 1.860 2.306
9 0.261 0.543 0.883 1.100 1.383 1.833 2.262
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228
Confianza à 95%
11
α = 0.05
0.260 0.540 0.876 1.088 1.363 1.796 2.201
12 0.259 0.539 0.873 1.083 1.356 1.782 2.179
13 0.259 0.538 0.870 1.079 1.350 1.771 2.160
14 0.258 0.537 0.868 1.076 1.345 1.761 2.145 α/2 = 0.025
15 0.258 0.536 0.866 1.074 1.341 1.753 2.131
16 0.258 0.535 0.865 1.071 1.337 1.746 2.120
17 0.257 0.534 0.863 1.069 1.333 1.740 2.110
18 0.257 0.534 0.862 1.067 1.330 1.734 2.101
19 0.257 0.533 0.861 1.066 1.328 1.729 2.093
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074
23
n = 20
0.256 0.532 0.858 1.060 1.319 1.714 2.069
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064
medades de-
una muestra aleatoria de 12. Se toman mediciones de la
dureza de Rockwell para cada una de las 12 cabezas y
se obtiene un valor promedio de 48.50, con una desvia-
ción estándar muestral de 1.5. Suponga que las medicio-
nes se distribuyen de forma normal y con base en esto
construya un intervalo de confianza de 90% para la du-
Ejemplo
reza media de Rockwell.
9.14 Se registran las siguientes mediciones del tiempo
> qqnorm(plomo)
> qqline(plomo)
que sus baterías durarán, en promedio, 3 años con una para σ en el e
varianza de 1 año. Suponga que 5 de estas baterías tie-
nen duraciones de 1.9, 2.4, 3.0, 3.5 y 4.2 años y con 9.77 Constr
base en esto construya un intervalo de confianza del para σ1/σ2 en
Ejemplo
95% para σ 2, después decida si la afirmación del fabri- σ1 y σ2 son, r
cante de que σ 2 = 1 es válida. Suponga que la pobla- para las dista
ción de duraciones de las baterías se distribuye de de los camion
forma aproximadamente normal.
9.78 Constr
9.72 Una muestra aleatoria de 20 estudiantes obtuvo para σ 2/σ 2
1 2
una media de x̄ = 72 y una varianza de s = 16 en un justifica que
2
> limite_inf<-(24/100-qnorm(0.025,mean=0,sd=1,lower.tail =
FALSE)*sqrt((24/100*76/100)/100))
> limite_sup<-(24/100+qnorm(0.025,mean=0,sd=1,lower.tail =
FALSE)*sqrt((24/100*76/100)/100)) IC(π; 95%) = [0.16 ; 0.32]
> limite_inf
[1] 0.1562932
> limite_sup 302
P_Walpole-09.indd La proporción de hombreas africanos
[1] 0.3237068 que padecen este trastorno sanguíneo
está entre 0.16 y 0.32
Ejemplo
29. Selección del género El Genetics and IVF Institute realizó una prueba clínica del método
XSORT, diseñado para incrementar la probabilidad de concebir una niña. Para cuando se escribía
este libro, ya habían nacido 574 bebés de padres que utilizaron el método XSORT, y 525 de esos
bebés eran niñas.
a) ¿Cuál es la mejor estimación puntual de la proporción poblacional de niñas nacidas de padres
que usaron el método XSORT?
b) Utilice los datos muestrales para construir un intervalo de confianza del 95% para el porcen-
taje de niñas nacidas de padres que utilizaron el método XSORT.
c) Con base en el resultado, ¿parece que el método XSORT es eficaz? ¿Por qué?
À Una hipótesis es una afirmación que se realiza sobre el comportamiento de una población.
À Una prueba de hipótesis es un procedimiento estadístico para verificar los valores propuestos en
la hipótesis estadística.
Se encuentra en Se construyen las Se identifican los Con los datos de Se compara el Según la
el contexto del dos, a partir de valores críticos la muestra se valor del decisión
ejercicio o la afirmación en la distribución calcula el valor estimador con estadística se
investigación general, muestral del del estimador los valores concluye sobre
identificando el estimador críticos y se toma la afirmación
parámetro de la decisión general
interés y el valor estadística
propuesto
À Hipótesis nula: Representa las expresiones de: igualdad (=), mayor o igual (≥) y menor o igual (≤),
entre el parámetro y el valor específico.
À Hipótesis alterna: Representa las expresiones de: diferente a (≠), mayor (>) y menor (<), entre el
parámetro y el valor específico.
À Si la hipótesis alterna está definida con “<“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE COLA IZQUIERDA
À Si la hipótesis alterna está definida con “≠“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE DOS COLAS
À Si la hipótesis alterna está definida con “>“, entonces se tiene una prueba de hipótesis denominada
PRUEBA DE COLA DERECHA
Decisión Estadística
La afirmación en la (se toma sobre Ho)
población es:
Rechazar No rechazar
Verdadera Error tipo I No hay error
Falsa No hay error Error tipo II
En el sistema legal, al acusado se le considera inocente hasta que se demuestre que es culpable.
En este caso
Zona de
NO Zona de Zona de
rechazo NO NO
para Ho rechazo rechazo
para Ho para Ho
Zona de
Zona de Zona de
NO
NO NO
rechazo
rechazo rechazo
para Ho
para Ho para Ho
Rechazar Ho si No rechazar Ho si
π = 0.43 à Ho
Solución Ejemplo 2
π > 0.50 à Ha
µ < 5.4 à Ha
-Z0.01 = -2.33
La media poblacional no es menor 5.4
10. Temperaturas corporales humanas El conjunto de datos 2 del apéndice B incluye una
muestra de 106 temperaturas corporales, con una media de 98.20°F. Suponga que se sabe que s es
0.62°F. Utilice un nivel de significancia de 0.05 para someter a prueba la afirmación de que la
temperatura media corporal de la población es igual a 98.6°F, como suele creerse. ¿Existe evidencia
suficiente para concluir que esta creencia es errónea?
µ = 98.6 à Ho
14. Pesos de osos La salud de la población de osos del Yellowstone National Park es vigilada por
medio de las medidas periódicas que se realizan a osos anestesiados. Una muestra de 54 osos tiene
un peso medio de 182.9 libras. Suponiendo que sabemos que s es igual a 121.8 libras, utilice un
nivel de significancia de 0.05 para someter a prueba la afirmación de que la media poblacional de
todos estos pesos de osos es mayor que 150 libras.
µ > 150 à Ha
µ < 21.1 à Ha
p_valor < α, por lo tanto hay suficiente evidencia para rechazar Ho.
µ = 120 à Ho
22. Exceso de velocidad en California Se obtiene una muestra aleatoria simple de 40 velo-
cidades (en mi/h) de automóviles que viajaban en una sección de la carretera 405 en Los Ángeles.
La muestra tiene una media de 68.4 mi/h y una desviación estándar de 5.7 mi/h (según datos de
Sigalert). Utilice un nivel de significancia de 0.05 para someter a prueba la afirmación de que la ve-
locidad media de todos los automóviles es mayor que la velocidad máxima permitida de 65 mi/h.
µ > 65 à Ha
σ < 14.1 à Ha
> pnorm(Zp, mean=0, sd=1, > 2*pnorm(Zp, mean=0, > 2*pnorm(Zp, mean=0, > pnorm(Zp, mean=0, sd=1,
Normal
lower.tail = TRUE) sd=1, lower.tail = TRUE) sd=1, lower.tail = FALSE) lower.tail = FALSE)
> 2*pt(tp, gl, lower.tail = > 2*pt(tp, gl, lower.tail = > pt(tp, gl, lower.tail =
t > pt(tp, gl, lower.tail = TRUE)
TRUE) FALSE) FALSE)
> pchisq (χ2p, gl, lower.tail = > 2*pchisq (χ2p, gl, > 2*pchisq(χ2p, gl, lower.tail > pchisq(χ2p, gl, lower.tail =
Chi-cuadrado
TRUE) lower.tail = TRUE) = FALSE) FALSE)