INVESTIGACIÓN

NOMBRES: AXEL REINOSO
MISHELL ACOSTA
DAVID PILLAJO
JOSÉ JIMENEZ
CARRERA: INGENIERÍA MECATRÓNICA
TEMA: TRABAJO FINAL DE CONSULTA INVESTIGACIÓN
FECHA: 17- 02-2021
ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA

ÍNDICE
I. Intervalo de confianza para la media…………………………………………… 3
A. Intervalo de Confianza se Calcula en Base al Mejor Estimador Normal,
Varianza Conocida……………………………………………………………….. 3
B. Intervalo de Confianza para la media de una normal, varianza
desconocida………………………………………………………………………. 6
II. Intervalo de confianza para la una proporción………………………………… 8
III. Intervalo de confianza para la diferencia de medias…………………………. 12
A. Intervalo de confianza para la diferencia de medias de dos distribuciones
normales, varianzas desconocidas pero iguales……………………………. 12
B. Intervalo de confianza para la diferencia de medias de dos distribuciones
normales, varianzas desconocidas pero diferentes………………………… 15
IV. Intervalo de confianza para la diferencia de proporciones………………..… 18
V. Diferentes formas del cálculo del tamaño de la muestra……………………. 20
A. Cálculo del tamaño de la muestra desconociendo el tamaño de la
población………………………………………………………………………… 22
B. Cálculo del tamaño de la muestra conociendo el tamaño de la
población………………………………………………………………………… 24
C. Cálculo del tamaño de la muestra para estimar una
media…………………………………………………………………………….. 28
D. Cálculo del tamaño de la muestra para contraste de hipótesis…………….. 30
VI. Prueba de hipótesis respecto a la media……………………………………… 31
VII. Prueba de hipótesis respecto a una proporción……………………………… 36
VIII. Prueba de hipótesis respecto a dos medias………………………………...... 39
IX. Prueba de hipótesis respecto a dos proporcione………………………….… 42
X. Bibliografía………………………………………………………………………. 48
I. INTERVALO DE CONFIANZA PARA LA MEDIA
A. Intervalo de Confianza se Calcula en Base al Mejor
Estimador Normal, Varianza Conocida.
El intervalo de confianza se calcula en base al mejor estimador de m, la media
muestral 𝑋̅.
Por tanto,
̅ < 𝑔2 (𝜇)⌋ = 1 − 𝛼
𝑃⌊𝑔1 (𝜇) < 𝑋
de manera que
𝑔1 (𝜇)
𝛼
∫ 𝑓(𝑥̅ , 𝜇) 𝑑𝑥̅ =
−∞ 2
y
∞
𝛼
∫ 𝑓(𝑥̅ , 𝜇) 𝑑𝑥̅ =
𝑔2 (𝜇) 2
̅.
En donde f es la función de densidad de la distribución de muestreo de 𝑋
Dado que
𝜎
𝑋̅ → 𝑁 (𝜇; )
√𝑛
y, por tanto
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Sigue una normal N (0;1) se sigue:

𝑔1 (𝜇) − 𝜇 𝑔2 (𝜇) − 𝜇
𝑝[𝑔1 (𝜇) < 𝑋̅ < 𝑔2 (𝜇)] = 𝑝 [ 𝜎 <𝑍< 𝜎 ]=1−𝛼
√𝑛 √𝑛
Pero
𝑃 [𝑍𝛼⁄2 < 𝑧 < 𝑍1−𝛼⁄ ] = 1 − 𝛼

2
se sigue que
𝑔1 (𝜇) − 𝜇 𝑔2 (𝜇) − 𝜇
𝜎 = 𝑍𝛼⁄2 𝑦 𝜎 = 𝑍1−𝛼⁄
2
√𝑛 √𝑛
Despejando g1(m) y g2(m) se obtiene:

𝜎 𝜎
𝑔1 (𝜇) = 𝜇 + 𝑍𝛼⁄2 𝑦 𝑔1 (𝜇) = 𝜇 + 𝑍𝛼⁄2
√𝑛 √𝑛
Teniendo en cuenta que Z α/2 es igual a –Z1-α/2 el intervalo queda de la forma:
𝜎 𝜎
𝑃 [𝜇 − 𝑧1−𝛼⁄ < 𝑋̅ < 𝜇 + 𝑍1−𝛼⁄ ]=1−𝛼
2 √𝑛 2 √𝑛
Al manipular las desigualdades de dentro del paréntesis, se tiene:
𝜎 𝜎
𝑃 [𝑋̅ − 𝑍1−𝛼⁄ < 𝜇 < 𝑋̅ + 𝑍1−𝛼⁄ ]= 1−𝛼
2 √𝑛 2 √𝑛
Si se reemplaza la variable aleatoria por los datos calculados a partir de una muestra
de tamaño n, un intervalo de confianza del 100(1-α) % para m, es:

𝜎
𝑋̅ ± 𝑍1−𝛼⁄
2 √𝑛
EN CONSECUENCIA:
Si (𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 ) una muestra aleatoria de tamaño n de una v.a. X donde
𝑋~𝑁(𝜇, 𝜎 2 ), 𝜎 2 conocido, un intervalo de confianza para µ de nivel 1-α es
𝜎 𝜎
[𝑋̅ − 𝑍𝛼 , 𝑋̅ + 𝑍𝛼 ]
2 √𝑛 2 √𝑛
Ejemplo 1:
Un ingeniero civil analiza la resistencia a la compresión del concreto. La
resistencia está distribuida aproximadamente de manera normal, con varianza
1000(psi)². Al tomar una muestra aleatoria de 12 especímenes, se tiene que 𝑋̅ =
3250 𝑝𝑠𝑖.
a) Construya un intervalo de confianza del 95% para la resistencia a la
compresión promedio.
b) Construya un intervalo de confianza del 99% para la resistencia a la
compresión promedio. Compare el ancho de este intervalo de confianza con
el ancho encontrado en el inciso a).
Solución:
La v.a. de interés es 𝑋𝑖 “resistencia a la compresión del concreto en un espécimen
i”
Tenemos una muestra de n=12 especímenes.
Asumimos que 𝑋𝑖 ̴ N (µ, ợ²) para i = 1,2, 3, … ,12 con ợ² = 1000
a) Queremos un intervalo de confianza para µ de nivel 95%. Por lo tanto, a =
0.05
ợ ợ
El intervalo para utilizar es: [𝑋̅ − 𝑧µ , 𝑋 + 𝑧µ [
2 √𝑛 2 √𝑛
Buscamos en la tabla de la normal estándar el valor de 𝑧µ = 𝑧0.025 = 1.96

2
Reemplazando:
√1000 √1000
[3250 − 1.96𝑋 , 3250 + 1.96𝑋 ] = [3250, 10773, 3267.89227]
√12 √12
b) Repetimos lo anterior pero ahora a = 0.01

ợ ợ
El intervalo para utilizar es [𝑋̅ − 𝑧µ , 𝑋 + 𝑧µ ]
2 √𝑛 2 √𝑛
Buscamos en la tabla de la normal estándar el valor de 𝑧µ = 𝑧0.005 = 2.58

2
Reemplazando:
√1000 √1000
[3250 − 2.58𝑋 , 3250 + 2.58𝑋 ] = [3226,44793, 3273.55207]
√12 √12
La longitud del intervalo encontrado en a) es: 35.78454
La longitud del intervalo encontrado en b) es: 47.10414
B. Intervalo de Confianza para la media de una normal, varianza

desconocida.
Cuando se muestrea una población normal N (m, s), el estadístico
𝑋̅ − 𝜇
𝑇= 𝑠
√𝑛
sigue una t-Student con n-1 grados de libertad, donde
∑𝑛𝑖=1(𝑋1 − 𝑋̅)2
2
𝑠 =
(𝑛 − 1)
Por lo tanto, es posible determinar el cuantil t1-α/2, n-1 de T, para el cual
𝑃 (−𝑡1−𝛼⁄ < 𝑇 < 𝑡1−𝛼⁄ ) =1−𝛼

2,𝑛−1 2,𝑛−1
Al sustituir T por su valor se obtiene
𝑋̅ − 𝜇
𝑃 (−𝑡1−𝛼⁄ < < 𝑡1−𝛼⁄ ,𝑛−1 ) = 1 − 𝛼
2,𝑛−1 𝑆 2
√𝑛
de donde
𝑆 𝑆
𝑝 (𝑋̅ − 𝑡1−𝛼⁄ < 𝜇 < 𝑋̅ + 𝑡1−𝛼⁄ ) = 1−𝛼
2,𝑛−1 √𝑛 2,𝑛−1 √𝑛
La probabilidad de que este intervalo aleatorio contenga a la media poblacional es
de 1-α.
Para una muestra particular de tamaño n, a partir de los valores estimados de 𝑋̅ y
de s2, un intervalo de confianza del 100(1-α) % para m es:
𝑆
𝑋̅ ± 𝑡1−𝛼⁄
2,𝑛−1 √𝑛
EN CONCECUENCIA:
Si (𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 ) una muestra aleatoria de tamaño n de una v.a. X donde

𝑋~𝑁(𝜇, 𝜎 2 ), 𝜎 2 conocido, un intervalo de confianza para µ de nivel 1-α es
𝑆 𝑆
[𝑋̅ − 𝑡𝛼 , 𝑋̅ + 𝑡𝛼 ]
2 √𝑛 2 √𝑛
Ejemplo 2:
Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron
valores
1 1
𝑥1 , 𝑥2 , … , 𝑥10 tales que 𝑋̅ = ∑10 𝑥 = 10,48 ohms y 𝑆 = √ ∑10 (𝑥 − 𝑥̅ )2 =
10 𝑖=1 𝑖 9 𝑖=1 𝑖
1.36 𝑜ℎ𝑚𝑠. Supóngase que 𝑋~𝑁(𝜇, 𝜎 2 ).
Se desea obtener un intervalo de confianza para la esperanza poblacional 𝜇 al 90%
Tenemos que 1-a=0.90→ a=0.1→ a/2=0.05
De la tabla de la t de Student tenemos que 𝑡0.059 = 1.8331. Entonces el intervalo de
confianza buscado es:

𝑆 𝑆 1.36 1.36
[𝑋̅ − 𝑡𝜇,𝑛−1 , 𝑋̅ + 𝑡𝜇,𝑛−1 ] = [10.48 − 1,8331 , 10.48 + 1.8331 ]
2 √𝑛 2 √𝑛 √10 √10
Esto es: [9.69,11.27].
Si 𝜎 2 es desconocido y el tamaño de la muestra grande, entonces se puede probar
que al reemplazar 𝜎 2 por S, el estadístico.

̅̅̅̅̅̅
𝑋−𝜇
𝑍 = 𝑆/ ~𝑁(0.1) aproximadamente
√𝑛
y puedo construir el intervalo para 𝜇 como antes:
𝑆 𝑆
[𝑋̅ − 𝑧𝜇 , 𝑋̅ + 𝑧𝜇 ], pero su nivel es aproximadamente 1-α
2 √𝑛 2 √𝑛
II. INTERVALO DE CONFIANZA PARA UNA

PROPORCIÓN
Cuando tenemos una variable dicotómica (o de Bernoulli) a menudo interesa
saber en qué proporción de casos, p ocurre el éxito en la realización de un
experimento.
También nos puede interesar comparar la diferencia existente entre las
proporciones en distintas poblaciones.
Si queremos estimar el parámetro p, la manera más natural de hacerlo
consiste en definir la suma de estas, lo que nos proporciona que la distribución
del número de éxitos es una distribución Binomial.
Hay que recordar que la distribución Binomial podía ser aproximada a la
Normal cuando el tamaño de la muestra n es grande, y p no es una cantidad

muy cercana a cero o uno2:
𝑋 ↝ 𝐵(𝑛, 𝑝) ⟹ 𝑋 ↝ 𝑁(𝑛𝑝, 𝑛𝑝𝑞)
Tomamos como estimación de p la proporción de éxitos obtenidos en las n pruebas
p̂.
El error estándar para de la proporción (EEP) es:
𝑝(1 − 𝑝) 𝑝𝑞
𝐸𝐸𝑃 = √ =√
𝑛 𝑛
Para encontrar el intervalo de confianza a nivel de confianza (1-α) para p
se considera el intervalo que hace que la distribución de Z~N(0, 1) deje la
probabilidad α fuera del mismo. Como ya hemos visto, se considera el intervalo
cuyos extremos son los cuantiles α/2 y 1 − α/2. Así se puede afirmar con una
confianza de 1 −α que:
𝑝̂ 𝑞̂
𝑝 = 𝑝̂ ± 𝑧1−𝛼⁄ √
2 𝑛
Con el siguiente ejemplo, entenderéis mejor la construcción del intervalo de
confianza.
Ejemplo 3:
En una muestra de 40 sujetos extraída al azar de una determinada población hay
24 fumadores. Estimar la proporción de fumadores de la población con una
confianza del 95%.

SOLUCIÓN:
24
Estimación puntual: 𝑝̂ = 40 = 0,6 (60%)
1-α =0,95 entonces α=0.05, α/2=0.025, zα/2=1,96
Error estándar:
𝑝̂ (1 − 𝑝̂ )
√
𝑛
(0,6)(0,4)
√ = 0,0775
40
𝑝̂(1−𝑝̂)
I.C. 95% de p: 𝑝̂ ± 𝑧𝛼⁄2 √ = 0,60 ± (1,96)(0,0775)
𝑛
= 0,60 ± 0,152
I.C. al 95%: (0,448; 0,752)
Interpretación:
Con una confianza del 95% la proporción de fumadores en la población se sitúa
entre 0.448 y 0.752.
La confianza del 95% consiste en poder afirmar que, si repitiéramos la estimación
100 veces, el intervalo que hemos obtenido sería uno de los 95 que de hecho
contendrían la proporción de individuos que fuman en la población. Confiamos en
qué esté sea uno de los 95 intervalos de cada 100 que incluyen a la proporción
poblacional y no sea uno de los 5 intervalos de cada 100 que no la incluyen.

1. Elección del tamaño muestral para una proporción
Muchas veces, una vez fijado el nivel de confianza, nos marcaremos como objetivo
dar el valor del parámetro p con una cierta precisión. La única forma de obtener la
precisión deseada será modificando de forma adecuada el tamaño de la muestra.
Si pretendemos reducir el error al 1% y queremos aumentar el nivel de confianza
hasta el 97% (α = 0,03) hemos de tomar una muestra de mayor tamaño, N.
Un valor de N que satisface nuestros requerimientos con respecto al error es:
Si en un principio no tenemos una idea sobre que valores puede tomar p, debemos
considerar el peor caso posible, que es en el que se ha de estimar el tamaño
muestral cuando p = q = 1/2.
Ejemplo 4:
Se quiere estimar el resultado de un referéndum mediante un sondeo, y sin tener
una idea sobre el posible resultado del mismo, se desea conocer el tamaño de
muestra que se ha de tomar para obtener un intervalo al 97% de confianza, con un
error del 1%.
Como no se tiene una idea previa del posible resultado del referéndum, hay que
tomar un tamaño de muestra, N, que se calcula mediante:
1 𝑧0,985 2 (0,25)(2,17)2
𝑁 ≥ ( )( ) =
4 0,001 0,012
= 11,773
Así para tener un resultado tan fiable, el número de personas a entrevistar es muy
elevado, lo que puede volver excesivamente costoso el sondeo.
III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA
DE MEDIAS
En esta sección se verá el caso en donde se tienen dos poblaciones con
medias y varianzas desconocidas, y se desea encontrar un intervalo de confianza
para la diferencia de dos medias 𝜇1 − 𝜇2 . Si los tamaños de muestras n1 y
n2 son mayores que 30, entonces, puede emplearse el intervalo de
confianza de la distribución normal. Sin embargo, cuando se toman
muestras pequeñas se supone que las poblaciones de interés están
distribuidas de manera normal, y los intervalos de confianza se basan en
la distribución t.
A. Intervalo de confianza para la diferencia de medias de dos

distribuciones normales, varianzas desconocidas pero iguales.
Si 𝑥̅1 , 𝑥̅2 , 𝑠1 2 y 𝑠2 2 son las medias y las varianzas de dos muestras
aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos
poblaciones normales e independientes con varianzas desconocidas pero

iguales, entonces un intervalo de confianza del 100(1 − 𝛼) por ciento para
la diferencia entre medias es:
1 1
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡𝑠𝑝 √ +
𝑛1 𝑛2
En donde:
2
𝑠1 2 (𝑛1 − 1) + 𝑠2 2 (𝑛2 − 1)
𝑠𝑝 =
𝑛1 + 𝑛2 − 2
es el estimador combinado de la desviación estándar común de la población con
n1+n2 – 2 grados de libertad.
Ejemplo 5:
Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio
en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de
calcio indican que el mecanismo de hidratación del cemento queda bloqueado y
esto permite que el agua ataque varias partes de una estructura de cemento. Al
tomar diez muestras de cemento estándar, se encontró que el peso promedio de
calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15

muestras de cemento contaminado con plomo fueron de 87 en promedio con una
desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está
distribuido de manera normal. Encuéntrese un intervalo de confianza del 95% para
la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase
que las dos poblaciones normales tienen la misma desviación estándar.
Solución:
El estimador combinado de la desviación estándar es:
2
𝑠1 2 (𝑛1 − 1) + 𝑠2 2 (𝑛2 − 1)
𝑠𝑝 =
𝑛1 + 𝑛2 − 2
52 (10 − 1) + 42 (15 − 1)
=
10 + 15 − 2
= 19,52
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
1 1
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡𝑠𝑝 √ +
𝑛1 𝑛2
1 1
= (90 − 87) ± (2,069)(4,41)√ +
10 15
expresión que se reduce a:
−0,72 ≤ 𝜇1 − 𝜇2 ≤ 6,72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente,
para este nivel confianza, no puede concluirse la existencia de una diferencia
entre las medias.
B. Intervalo de confianza para la diferencia de medias de dos
distribuciones normales, varianzas desconocidas pero
diferentes.
Consideremos ahora el problema de encontrar una estimación por
intervalos de 𝜇1 − 𝜇2 cuando no es probable que las varianzas
poblacionales desconocidas sean iguales. La estadística que se usa con
más frecuencia en este caso es:
(𝑥̅1 − 𝑥̅2 )(𝜇1 − 𝜇2 )

𝑡=
𝑠1 2 𝑠2 2
√
𝑛1 + 𝑛2
que tiene aproximadamente una distribución t con V grados de libertad, donde:
𝑠1 2 𝑠2 2
( + )
𝑛1 𝑛2
𝑉= 2 2
𝑠 2 𝑠 2
( 1 ) ( 2 )
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
Como V rara vez es número entero, lo redondeamos al número entero

más cercano menor. Esto es si el valor de nu es de 15.9 se redondeará a
15.
Al despejar la diferencia de medias poblacionales de la fórmula de t nos

queda:
𝑠1 2 𝑠2 2
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡 √ +
𝑛1 𝑛2
Ejemplos 6:
El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio
para estimar la diferencia en la cantidad de ortofósforo químico medido en dos
estaciones diferentes del río James. El ortofósforo se mide en miligramos por litro.
Se reunieron 15 muestras de la estación 1 y se obtuvo una media de 3.84 con una
desviación estándar de 3.07 miligramos por litro, mientras que 12 muestras de la
estación 2 tuvieron un contenido promedio de 1.49 con una desviación estándar
0.80 miligramos por litro. Encuentre un intervalo de confianza de 95% para la
diferencia del contenido promedio real de ortofósforo en estas dos estaciones,
suponga que las observaciones vienen de poblaciones normales con varianzas
diferentes.
Solución:
Datos:
Estación 1 Estación 2
n1=15 n2=12
𝑥̅1 =3,84 𝑥̅2 =1,49
s1=3,07 s2=0,80
Primero se procederá a calcular los grados de libertad:

𝑠1 2 𝑠2 2
( )
𝑛1 + 𝑛2
𝑉= 2 2
𝑠 2 𝑠 2
( 1 ) ( 2 )
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
3,072 0,802
( + 12 )
15
𝑉= 2 2
3,072 0,802
( ) ( )
15 12
+
(15 − 1) (12 − 1)
[ ] [ ]
𝑉 = 16,3 ≈ 16
Al usar 𝛼 = 0,05, encontramos en la tabla con 16 grados de libertad que el
valor de t es 2.120, por lo tanto:
𝑠1 2 𝑠2 2
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡 √ +
𝑛1 𝑛2
3,072 0,802
𝜇1 − 𝜇1 = (3,84 − 1,49) ± 2,120√ +
15 12
que se simplifica a:
0,60 ≤ 𝜇1 − 𝜇1 ≤ 4,10
Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10 miligramos
por litro contiene la diferencia de los contenidos promedios reales de ortofósforo
para estos dos lugares.
IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA
DE PROPORCIONES
Cuando se requiere saber si las proporciones de éxitos de dos poblaciones (P1 y
P2) son iguales o no, por ejemplo, la proporción de artículos defectuosos de la
máquina 1 (P1) y la proporción de artículos defectuosos de la máquina 2 (P 2), se
construirá un intervalo de confianza para la diferencia de estas proporciones como
sigue:
𝑝̂1 (1−𝑝̂1 ) 𝑝̂2 (1−𝑝̂2 ) 𝑝̂1 (1−𝑝̂1 ) 𝑝̂2 (1−𝑝̂2 )

(𝑝̂1 − 𝑝̂2 ) − 𝑧𝛼 √ + ≤ 𝑃1 − 𝑃2 ≤ (𝑝̂1 − 𝑝̂ 2 ) + 𝑧𝛼 √ +
2 𝑛1 𝑛2 2 𝑛1 𝑛2
o de manera breve
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂ 2 )

(𝑝̂1 − 𝑝̂2 ) ± 𝑧𝛼 √ +
2 𝑛1 𝑛2
Si el intervalo construido contiene al 0 (es decir que un límite sea negativo y el otro
positivo) se concluye que las dos proporciones de éxitos poblacionales son iguales.
Cuando el 0 no esté contenido habrá dos maneras de interpretar:
• Si los dos límites son positivos se dice que la proporción de éxitos en la
población 1 es mayor que la proporción de éxitos en la población 2.
• Si los dos límites son negativos se dice que la proporción de éxitos en la
población 1 es menor que la proporción de éxitos en la población 2.

Ejemplo 7:
Se quiere saber si la proporción de mujeres zurdas en ITSON (P1) difiere o no de la
proporción de hombres zurdos en ITSON (P2).
Para poder responder a ese cuestionamiento deben seleccionarse muestras
aleatorias de hombres y mujeres. Suponga que se seleccionaron 200 hombres y
220 mujeres de los cuales 20 hombres y 23 mujeres resultaron ser zurdos.
• Calcular el porcentaje de éxitos en las muestras (P1 y P2).
Hay un 10.45% de mujeres zurdas en la muestra:
𝑥1
𝑝̂1 =
𝑛1
23
=
220
= 0,1045
y un 10% de hombres zurdos en la muestra:
𝑥2
𝑝̂ 2 =
𝑛2
20
=
220
= 0,10
• Según la confianza el valor de Zα/2 será cómo sigue:
o 99% ——— 2.58
o 95% ——— 1.96
o 90% ——— 1.65
En este caso si se establece la confianza en 95% el valor de z será 1.96.
Luego sustituimos en la fórmula del intervalo:
𝑝̂1 (1 − 𝑝̂1 ) 𝑝̂2 (1 − 𝑝̂ 2 )

(𝑝̂1 − 𝑝̂2 ) ± 𝑧𝛼 √ +
2 𝑛1 𝑛2
Primero, el límite inferior del intervalo:
= −0,05344
y un 10% de hombres zurdos en la muestra:
= 0,06254
• Finalmente, la interpretación será:
El intervalo va de -0.054 a 0.062 o de -5.4% hasta 6.2%. Note que el 0 (cero) este
contenido en el intervalo, por lo que se puede decir que:
Al 95% de confianza, la proporción de mujeres zurdas y la proporción de hombres
zurdos de ITSON es la misma.
V. PRUEBA DE HIPÓTESIS RESPECTO A LA MEDIA
Determinar el tamaño de la muestra que se va a seleccionar es un paso importante
en cualquier estudio de investigación de mercados, se debe justificar

convenientemente de acuerdo con el planteamiento del problema, la población, los
objetivos y el propósito de la investigación.
El tamaño muestral dependerá de decisiones estadísticas y no estadísticas, pueden
incluir por ejemplo la disponibilidad de los recursos, el presupuesto o el equipo que
estará en campo.
Antes de calcular el tamaño de la muestra necesitamos determinar varias cosas:
1. Tamaño de la población. Una población es una colección bien definida de
objetos o individuos que tienen características similares. Hablamos de dos
tipos: población objetivo, que suele tiene diversas características y también
es conocida como la población teórica. La población accesible es la población
sobre la que los investigadores aplicaran sus conclusiones.
2. Margen de error (intervalo de confianza). El margen de error es una
estadística que expresa la cantidad de error de muestreo aleatorio en los
resultados de una encuesta, es decir, es la medida estadística del número de
veces de cada 100 que se espera que los resultados se encuentren dentro
de un rango específico.
3. Nivel de confianza. Son intervalos aleatorios que se usan para acotar un
valor con una determinada probabilidad alta. Por ejemplo, un intervalo de
confianza de 95% significa que los resultados de una acción probablemente
cubrirán las expectativas el 95% de las veces.

4. La desviación estándar. Es un índice numérico de la dispersión de un
conjunto de datos (o población). Mientras mayor es la desviación estándar,
mayor es la dispersión de la población
Existen distintas fórmulas para calcular el tamaño de la muestra, según la población
sea finita o infinita, es decir, si conocemos el número de individuos que la componen
o si lo desconocemos
A. CÁLCULO DEL TAMAÑO DE LA MUESTRA

DESCONOCIENDO EL TAMAÑO DE LA POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se desconoce el tamaño de
la población es la siguiente
𝑍𝑎 2 × 𝑝 × 𝑞
𝑛=
𝑑2
En donde
Z = nivel de confianza
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (error máximo admisible en términos de proporción)

Donde "Z" es el intervalo de confianza al cuadrado, en este caso se pide que sea
del 95%, lo que indica que sería 1,96 al cuadrado, y cómo no sabemos la
probabilidad de que ocurra el evento, "p" y "q" sería 50%. Entre el margen de error
al solicitado al cuadrado. El resultado sería 1067,11, que también lo debemos
redondear.
Ejemplo 8:
¿Cuántas mujeres será necesario estudiar para estimar la prevalencia de dolor
lumbar en una población de embarazadas?
Con un nivel de confianza del 95% (α= 0,05; Zα= 1,96), un error máximo admitido
del 8% (la amplitud del IC será 16) y un valor de prevalencia conocido por la
bibliografía del 20%, el tamaño de la muestra necesario será de 96 mujeres:
1.962 × 0.20 × 0.80 0.614656

𝑛= = = 96
0.082 0.0016
El tamaño de la muestra dependerá de los valores que se introduzcan en la fórmula,
de modo que, para una mayor precisión (IC más estrecho), se necesitará un mayor
tamaño de la muestra.
B. CÁLCULO DEL TAMAÑO DE LA MUESTRA CONOCIENDO
EL TAMAÑO DE LA POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la
población es la siguiente:
𝑁 × 𝑍𝑎 2 × 𝑝 × 𝑞
𝑛=
𝑑2 × (𝑁 − 1) + 𝑍𝑎2 × 𝑝 × 𝑞
En donde
N = tamaño de la población
Z = nivel de confianza,
P = probabilidad de éxito, o proporción esperada
Q = probabilidad de fracaso
D = precisión (Error máximo admisible en términos de proporción).
Los valores de Zα más utilizados y sus niveles de confianza son:
Valor de Zα 1.28 1.65 1.69 1.75 1.81 1.88 1.96
Nivel de confianza 80% 90% 91% 92% 93% 94% 95%

(Por lo tanto, si pretendemos obtener un nivel de confianza del 95% necesitamos
poner en la fórmula Zα=1.96)
Una muestra demasiado grande dará lugar a la pérdida de valiosos recursos como
tiempo y dinero, mientras que una muestra pequeña puede no proporcionar
información confiable.
Ejemplo 9:
Supongamos que nos piden calcular el tamaño para una población de 543.098
consumidores de una marca de bebidas energéticas, donde el investigador asigna
un nivel de confianza de 95% y un margen de error de 3%. Donde se desconoce la
probabilidad “p” del evento.
Basándonos en este ejemplo, y en nuestra fórmula, el "N" será 543.098, nuestro Z
será 1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e”
será de 3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de que
ocurra el evento, se asigna un 50% a "p" y un 50% a "q".
El resultado de nuestro tamaño de muestra sería: 1065.2, y tendría que ser
redondeado pues estamos hablando de personas.
¿Cómo tener una muestra representativa y adecuada?
Es mucho mejor tener a las personas adecuadas para contestar nuestra encuesta,
que tener una gran cantidad de personas equivocadas que no nos van a aportar la
información que necesitamos.

Una muestra representativa está integrada por personas con intereses similares a
nuestro objeto de estudio, no tiene que ver, en este caso, con el tamaño.
Lo ideal es poder seleccionar a los encuestados de una población representativa de
una manera aleatoria, por ejemplo, seleccionar a cada 5 miembros de una lista de
correos de usuarios que sean realmente representativos para nuestra investigación.
Una vez que tengas la muestra adecuada, hay que decidir el tamaño de la muestra
que desees estudiar. Cuanto más precisa quieres que sea, más grande debe ser el
tamaño.
Margen de error y nivel de confianza
El margen de error es el porcentaje de variación aceptable que existe en los
resultados de la investigación. Es la manera de aceptar que los datos no son
absolutamente exactos o precisos.
Generalmente las encuestas se basan en información obtenida de una muestra de
la población, es lógico que pueda ocurrir un error de muestreo.
Si el 90% de los encuestados respondió que “Sí”, mientras que el 10% no contestó
la encuesta, es un margen de error, podríamos decir “bueno”, a tener un 50-50 o
45-55.
Por lo regular el margen de error puede ser controlado eligiendo una muestra
aleatoria y aumentando el tamaño de la muestra, lamentablemente el presupuesto
puede llegar a ser un limitante.

Menor margen de error requiere un tamaño de muestra más grande. El incrementar
el tamaño de la muestra aumenta el nivel de confianza. ¿Qué nivel de confianza se
necesita? Las opciones típicas son 90%, 95%, o 99%.
Para calcular el intervalo de confianza deben tenerse en cuenta tres factores:
1. El tamaño de la muestra que se entrevistó.
2. La tasa de muestreo (es decir, la proporción de la muestra con respecto a la
población: Una muestra de 100 personas de una población de 400 no da la
misma precisión que una muestra de 100 personas de una población de
400.000).
3. La distribución de las respuestas: 50% satisfecho no da la misma precisión
que 80% satisfecho.
Cuando hacemos una investigación debemos tener cuidado con las decisiones que
tomamos en el camino; Hacer un plan de acción ayuda a resolver en gran medida
problemas que puedan surgir y a mantener el rumbo hacia tus objetivos.

C. CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA ESTIMAR
UNA MEDIA
Siguiendo el mismo razonamiento que para la estimación de proporciones, a partir
de la fórmula del IC de la media se obtiene la fórmula para calcular el tamaño de la
muestra necesario para estimar una media:
𝑍𝑎2 ×𝐷𝐸2
𝑛=
𝑑2
Ejemplo 10:
¿Cuántas mujeres será necesario estudiar para estimar la media de glucemia
de las embarazadas que han acudido al servicio de paritorio de un
determinado hospital?
Estableciendo un nivel de confianza del 95% y una precisión de 5 (la diferencia entre
la media de glucemia de la población y la de la muestra, será ≤ 5 mg); faltaría por
conocer la DE. Se supone que se ha obtenido a partir de la prueba piloto y que es
de 20. Por lo que el número mínimo de mujeres que ha de estudiarse será de 62.
1.962 × 202
𝑛= = 62
52
Además, cuando se pretenda determinar el tamaño que debe tener una muestra,
hay que tener en consideración el tipo de muestreo. Casi todas las fórmulas que se
utilizan asumen que el muestreo es aleatorio, es decir, que todos los sujetos tienen
la misma probabilidad de entrar a formar parte del estudio. Si el muestreo no es
aleatorio, se tiene en cuenta el llamado «efecto de diseño», por el que se ha de
multiplicar el valor calculado. En el muestreo aleatorio este valor es 1.
Generalmente, este valor está entre 1,5 y 3. Así, un valor igual a 2, por ejemplo, con
un muestreo estratificado, significa que para obtener la misma precisión habrá que
estudiar al doble de individuos que con muestreo aleatorio. Si se necesitaban 200,
se deberán estudiar 400 (200 × 2). Otro aspecto que debe tenerse en cuenta es el
de las pérdidas que se prevén, es decir, los sujetos de los cuales no se tendrá
información. Para cuantificarlas se usa la siguiente fórmula:
𝑛
𝑛𝑐 =
1 − 𝑝𝑒
nc = tamaño de la muestra, teniendo en cuenta las pérdidas
n = tamaño de la muestra, sin tener en cuenta las pérdidas
pe = porcentaje esperado de pérdidas

Ejemplo 11:
Si el tamaño de la muestra calculado es de 96 mujeres y se estiman unas pérdidas esperadas del
20%, el total de mujeres que deberá estudiarse será de 120.
96
𝑛𝑐 = = 120
1 − 0.20
D. CÁLCULO DEL TAMAÑO DE LA MUESTRA PARA

CONTRASTE DE HIPÓTESIS
Es el caso de los estudios con un diseño experimental, en los que se hace una
intervención en dos grupos, la habitual al «grupo control» y la que se pretende
evaluar al «grupo experimental». Lo que desea el investigador es conocer si hay
diferencias entre los dos grupos, para lo que plantea un contraste de hipótesis, con
la comparación de medias o proporciones, dependiendo del tipo de variables. Se
plantean así dos tipos de hipótesis: la nula y la alternativa. En la primera se
establece que no hay diferencias entre los dos grupos para la variable de interés;
en la segunda, sí se plantea una diferencia, que es la que se pretende encontrar
con el estudio.
2
[𝑍𝑎 × √2𝑝(1 − 𝑝) + 𝑍𝑏 × √𝑝1(1 − 𝑝1) + 𝑝2(1 − 𝑝2)]
𝑛=
(𝑝1 − 𝑝2)2
Donde: Zα es el valor Z correspondiente al riesgo α fijado; Zβ es el valor Z
correspondiente al riesgo β fijado; p1 es el valor de la proporción en el grupo control;
p2 es el valor de la proporción en el grupo experimental, y p es la media aritmética
de las dos proporciones, p1 y p2 (p1 + p2/2)
VI. PRUEBA DE HIPOTESIS RESPECTO A LA MEDIA
En vez de estimar el valor de un parámetro, a veces se debe decidir si una
afirmación relativa a un parámetro es verdadera o falsa. Es decir, probar una
hipótesis relativa a un parámetro. Se realiza una prueba de hipótesis cuando se
desea probar una afirmación realizada acerca de un parámetro o parámetros de una
población.
Una hipótesis es un enunciado acerca del valor de un parámetro (media, proporción,
etc.). Prueba de Hipótesis es un procedimiento basado en evidencia muestral
(estadístico) y en la teoría de probabilidad (distribución muestral del estadístico)
para determinar si una hipótesis es razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazada.
La hipótesis de que el parámetro de la población es igual a un valor determinado se
conoce como hipótesis nula. Una hipótesis nula es siempre una de status quo o de
no diferencia.
En la estadística uno de los procedimientos para probar la validez de un enunciado
relativo a un parámetro poblacional basándose en la evidencia muestral, es sin duda
la Prueba de hipótesis. Una parte muy útil de la estadística son las pruebas de
hipótesis
Para entender bien que es una prueba de hipótesis es necesario tener claros los
conceptos de: variable, parámetro, estimador de un parámetro, hipótesis estadística
y estadístico de prueba.
VARIABLE: es una característica de interés, que tienen los individuos/ objetos de
una población
PARÁMETRO: es una constante asociada a la distribución de probabilidades de
una variable aleatoria
ESTIMADOR: es un estadístico (estadístico: variable aleatoria función de las
observaciones muestrales) que toma “valores cercanos” al verdadero valor del
parámetro
Se simboliza con el símbolo Ho y cuando se desarrollan la prueba asume que la
hipótesis nula es verdadera y este será rechazado sólo si se encuentran suficientes
evidencias en base a la información muestral
siempre que se especifica una hipótesis nula también se debe especificar una
hipótesis alternativa o una que debe ser verdadera si se encuentra que la hipótesis
nula es falsa .la hipótesis alternativa se simboliza H1 la hipótesis alternativa
representa la conclusión a la que se llegaría si hubiera suficiente evidencia de la
información de la muestra para decidir que es improbable que la hipótesis nula sea
verdadera y por tanto rechazarla es siempre opuesta a la hipótesis nula
En toda prueba de hipótesis se pueden cometer 2 tipos de errores:

1) Error tipo l se comete error tipo l cuando se rechaza el H0 siendo esta
realmente verdadera a la probabilidad de cometer el error tipo l se le conoce
como nivel de significación y se le nota 𝜶
2) Error tipo II se comete error tipo II cuando no se rechaza el h0 si éste
realmente es falso a la probabilidad de cometer errores tipo II se le denota
cómo ve el complemento de la probabilidad de cometer un error tipo II se le
llama potencia de la prueba y se denota como 1 – 𝜷
Se utiliza una prueba de una muestra para probar una afirmación con respecto a
una media de una población única.
Si se conoce la desviación estándar de la población (𝜎) la distribución de muestreo
adecuada es la distribución normal si la población de muestra es normal la
distribución de muestreo será normal en el caso de todos los tamaños de la muestra
y el valor estadístico de prueba a utilizar es
𝑋̅ − 𝜇
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝜎 ~𝑁(0,1)
√𝑛
Si la población no es normal o si desconoce su forma se emplea la ecuación anterior
solamente para tamaños de muestras iguales o mayores de 30 es decir para n ≥ 30
si no se conoce la desviación estándar de la población (𝜎)

Si las condiciones son (lo único que cambia es que no conocemos el desvío
poblacional):
• La variable X es normal
• No conocemos el desvío estándar poblacional σ, así que lo estimamos
usando el desvío estándar muestral S
Usamos:
𝑋̅ − 𝜇
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = ~𝑡𝑛 − 1
𝑆
√𝑛
Por último, si las condiciones son:
• La variable X no sabemos que distribución tiene (puede ser cualquier
distribución)
• Conocemos el desvío estándar poblacional σσ
• El tamaño de la muestra debe ser grande n≥30n≥30
Usamos:
𝑋̅ − 𝜇
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝜎 ≈ 𝑁(0,1)
√𝑛
La distribución en este caso no es exactamente normal, sino aproximadamente
normal.
¿Por qué? Porque tenemos que usar el teorema central del límite para conocer la
distribución de 𝑋̅ Y el teorema dice que𝑋̅ tiende a la distribución normal en la medida
en que n crece… pero no que tiene “exactamente” la distribución normal.
También se suele usar esta distribución aproximada si no se conoce σ:
Ejemplo 12:
La duración media de lámparas producidas por una compañía ha sido en el pasado
de 1120 horas. Una muestra de 8 lámparas de la producción actual dio una duración
media de 1070 horas con una desviación típica de 125 horas.
Comprobar la hipótesis 𝜇 =1120 horas contra la hipótesis alternativa 𝜇 <1200 horas
mediante un erro tipo I de 0.05.
Solución
Datos:
𝜇 =1120
n=8
𝑋̅=1070
S=125
𝛼=0.05
Las hipótesis son

Ho: 𝜇 = 1120
H1: 𝜇 <1120
Como se conoce la desviación estándar de la muestra se debe utilizar la distribución
T de student con lectura en la tabla para área de 0,025 y con n - 1 igual 8 – 7 grados
de libertad le corresponde un valor de Ttabla es = a -1.89 46 se toma en cuenta el
valor negativo porque se trata de una prueba de hipótesis a cola izquierda como se
puede observar en la H1
Entonces para el calcular el valor de T prueba se emplea la siguiente ecuación
𝑋̅ − 𝜇
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = ~𝑡𝑛 − 1
𝑆
√𝑛
1070 − 1120
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = = −1.131
125
√8
Respuesta: Dado que – 1.131 > Ttabla -1.8946 se acepta la Ho
VII. PRUEBA DE HIPÓTESIS RESPECTO A UNA

PROPORCIÓN
Cuando el objetivo del muestreo es evaluar la validez de una afirmación con
respecto a la proporción de una población, es adecuado utilizar una prueba de una

muestra. La metodología de prueba depende de si el número de observaciones de
la muestra es grande o pequeño.
Como se habrá observado anteriormente, las pruebas de grandes muestras de
medias y proporciones son bastante semejantes. De este modo, los valores
estadísticos de prueba miden la desviación de un valor estadístico de muestra a
partir de un valor propuesto. Y ambas pruebas se basan en la distribución normal
estándar para valores críticos. Quizá la única diferencia real entre las ambas radica
en la forma corno se obtiene la desviación estándar de la distribución de muestreo.
Esta prueba comprende el cálculo del valor estadístico de prueba Z
Ejemplo:
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
aseveración, a un nivel de significación de 0,025, respecto a la alternativa de que la
proporción real de los estudiantes universitarios trabajan es mayor de lo que se
afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de
ellos trabajan. La muestra fue tomada de 10000 estudiantes.
Los datos son:
Como en los datos aparece el tamaño de la población, se debe verificar si el tamaño
de la nuestra es mayor que el 5%. Se reemplaza valores en la siguiente fórmula:

CÁLCULOS REALIZADOS EN EXCEL:
VIII. PRUEBA DE HIPÓTESIS RESPECTO A DOS MEDIAS
El objetivo de una prueba de dos medias es determinar si las dos medias
independientes fueron tomadas de dos poblaciones, las cuales presentan la misma
proporción de elementos con determinada característica. La prueba se concentra
en la diferencia relativa (diferencia dividida entre la desviación estándar de la
distribución de muestreo) entre las dos proporciones muestrales. Diferencias
pequeñas denotan únicamente la variación casual producto del muestreo (se acepta
H0), en tanto que grandes diferencias significan lo contrario (se rechaza H0). El
valor estadístico de prueba (diferencia relativa) es comparado con un valor tabular
de la distribución normal, a fin de decidir si H0 es aceptada o rechazada. Una vez
más, esta prueba se asemeja considerablemente a la prueba de medias de dos
muestras.
La hipótesis nula en una prueba de dos muestras es
Ejemplo:
Se ponen a prueba la enseñanza de la Estadística empleando Excel y Winstats.
Para determinar si los estudiantes difieren en términos de estar a favor de la nueva
enseñanza se toma una muestra de 20 estudiantes de dos paralelos. De paralelo A
18 están a favor, en tanto que del paralelo B están a favor 14. ¿Es posible concluir
con un nivel de significación de 0,05 que los estudiantes que están a favor de la
nueva enseñanza de la Estadística es la misma en los dos paralelos?.
Los datos son:

Las hipótesis son
Calculando la proporción muestral se obtiene:

CÁLCULOS EN EXCEL:
IX. PRUEBA DE HIPÓTESIS RESPECTO A DOS
PROPORCIONES
La finalidad de una prueba de dos proporciones es evaluar la aseveración que
establece que todas las k muestras independientes provienen de poblaciones que
presentan la misma proporción de algún elemento. De acuerdo con esto, las
hipótesis nula y alternativa son

En una muestra se puede dar un conjunto de sucesos, los cuales ocurren con
frecuencias observadas "o"(las que se observa directamente) y frecuencias
esperadas o teóricas "e" (las que se calculan de acuerdo a las leyes de
probabilidad).
Por lo tanto el valor estadístico de prueba para este caso es la prueba ji cuadrado o
conocida también como chi cuadrado
Como sucede con las distribuciones t y F, la distribución ji cuadrado tiene una forma
que depende del número de grados de libertad asociados a un determinado
problema.
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en
la cola) a partir de una tabla de ji cuadrado, se debe seleccionar un nivel de
significación y determinar los grados de libertad para el problema que se esté
resolviendo.
Ejemplos ilustrativos:
Determine el número de grados de libertad y obtenga el valores crítico en el niveles
0,05 se significación.
Solución:
Los grados de libertad se calculan aplicando la fórmula:

Los cálculos en Excel se muestran en la siguiente figura:
2) La siguiente tabla muestra las frecuencias observadas y las frecuencias
esperadas al lanzar un dado 60 veces. Contrastar la hipótesis de que el dado es
bueno, con un nivel de significación de 0,01.
Cara del dado 1 2 3 4 5 6
Frecuencia 6 8 9 15 14 8
observada
Frecuencia 10 10 10 10 10 10
esperada
Solución:
X. BIBLIOGRAFÍA
• Suárez, Mario, (2012), Interaprendizaje de Probabilidades y Estadística
Inferencial con Excel, Winstats y Graph, Primera Edición. Imprenta M & V, Ibarra,
Ecuador.
• Ferrer, S. (1963). Estadistica . Instituto Latinoamericano de Planificación
Económica y Social.
• Sánchez Corona, O. (2004). Probabilidad y estadística . México: McGraw-Hill.
• Ledezma, A. (2021). Probabilidad y Estadística - Walpole, Myers. Consultado el
18 de febrero de 2021 en
https://www.academia.edu/34168638/Probabilidad_y_Estadistica_Walpole_My
ers
• Tamayo Vasquez, L. (2008). Estadistica . Medellín: Sello Editorial Universidad
de Medellín.
• Martínez Almécija, A., Muñoz García, J., & Pascual Acosta, A. (2004). Tamaño
de muestra y precisión estadística . Almería: Universidad de Almería. Servicio
de Publicaciones.
• Cochran, W. (1998). Técnicas de muestreo . México: Compañía Editorial
Continental.
• Pintarelli, M. (s.f). Parte 2 - Intervalos de confianza. Recuperado el 14 de febrero
de 2021, de:
https://www.mate.unlp.edu.ar/practicas/117_12_12092016211213.pdf
• Anónimo. (s.f). Estimación por intervalo. Recuperado el 14 de febrero de 2021,
de:http://www.juntadeandalucia.es/averroes/centrostic/14002996/helvia/aula/ar
chivos/repositorio/250/295/html/estadistica/intervalos.htm#uno
• Laguna, C. (s.f). Inferencia estadística: Estimación de parámetros. Intervalo de
confianza. Recuperado el 14 de febrero de 2021, de: http://www.ics-
aragon.com/cursos/salud-publica/2014/pdf/M2T05.pdf
• DIFERENCIA DE MEDIAS POBLACIONALES. (2021). Retrieved 14 February
2021, from http://www.ub.edu/aplica_infor/spss/cap4-
3.htm#:~:text=%2D%20Intervalo%20de%20confianza%2C%20por%20defecto,(
contraste%20de%20dos%20colas).
• Robles, J. (2021). Curso: Estadística I. Retrieved 14 February 2021, from
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03d.html

INVESTIGACIÓN

Cargado por

Información del documentohacer clic para expandir la información del documento

Copyright:

Formatos disponibles

INVESTIGACIÓN

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

INVESTIGACIÓN

Cargado por

Copyright:

Formatos disponibles

NOMBRES: AXEL REINOSO

CARRERA: INGENIERÍA MECATRÓNICA

TEMA: TRABAJO FINAL DE CONSULTA INVESTIGACIÓN

FECHA: 17- 02-2021

ASIGNATURA: PROBABILIDAD Y ESTADÍSTICA

I. Intervalo de confianza para la media…………………………………………… 3

A. Intervalo de Confianza se Calcula en Base al Mejor Estimador Normal,

B. Intervalo de Confianza para la media de una normal, varianza

II. Intervalo de confianza para la una proporción………………………………… 8

III. Intervalo de confianza para la diferencia de medias…………………………. 12

A. Intervalo de confianza para la diferencia de medias de dos distribuciones

normales, varianzas desconocidas pero iguales……………………………. 12

B. Intervalo de confianza para la diferencia de medias de dos distribuciones

normales, varianzas desconocidas pero diferentes………………………… 15

IV. Intervalo de confianza para la diferencia de proporciones………………..… 18

V. Diferentes formas del cálculo del tamaño de la muestra……………………. 20

A. Cálculo del tamaño de la muestra desconociendo el tamaño de la

B. Cálculo del tamaño de la muestra conociendo el tamaño de la

C. Cálculo del tamaño de la muestra para estimar una

VI. Prueba de hipótesis respecto a la media……………………………………… 31

VII. Prueba de hipótesis respecto a una proporción……………………………… 36

VIII. Prueba de hipótesis respecto a dos medias………………………………...... 39

IX. Prueba de hipótesis respecto a dos proporcione………………………….… 42

A. Intervalo de Confianza se Calcula en Base al Mejor

Estimador Normal, Varianza Conocida.

El intervalo de confianza se calcula en base al mejor estimador de m, la media

Sigue una normal N (0;1) se sigue:

𝑃 [𝑍𝛼⁄2 < 𝑧 < 𝑍1−𝛼⁄ ] = 1 − 𝛼

Despejando g1(m) y g2(m) se obtiene:

Teniendo en cuenta que Z α/2 es igual a –Z1-α/2 el intervalo queda de la forma:

Al manipular las desigualdades de dentro del paréntesis, se tiene:

de tamaño n, un intervalo de confianza del 100(1-α) % para m, es:

Un ingeniero civil analiza la resistencia a la compresión del concreto. La

resistencia está distribuida aproximadamente de manera normal, con varianza

1000(psi)². Al tomar una muestra aleatoria de 12 especímenes, se tiene que 𝑋̅ =

a) Construya un intervalo de confianza del 95% para la resistencia a la

b) Construya un intervalo de confianza del 99% para la resistencia a la

compresión promedio. Compare el ancho de este intervalo de confianza con

el ancho encontrado en el inciso a).

La v.a. de interés es 𝑋𝑖 “resistencia a la compresión del concreto en un espécimen

Tenemos una muestra de n=12 especímenes.

Asumimos que 𝑋𝑖 ̴ N (µ, ợ²) para i = 1,2, 3, … ,12 con ợ² = 1000

a) Queremos un intervalo de confianza para µ de nivel 95%. Por lo tanto, a =

Buscamos en la tabla de la normal estándar el valor de 𝑧µ = 𝑧0.025 = 1.96

b) Repetimos lo anterior pero ahora a = 0.01

Buscamos en la tabla de la normal estándar el valor de 𝑧µ = 𝑧0.005 = 2.58

La longitud del intervalo encontrado en a) es: 35.78454

La longitud del intervalo encontrado en b) es: 47.10414

B. Intervalo de Confianza para la media de una normal, varianza

Cuando se muestrea una población normal N (m, s), el estadístico

sigue una t-Student con n-1 grados de libertad, donde

Por lo tanto, es posible determinar el cuantil t1-α/2, n-1 de T, para el cual

𝑃 (−𝑡1−𝛼⁄ < 𝑇 < 𝑡1−𝛼⁄ ) =1−𝛼

Al sustituir T por su valor se obtiene

La probabilidad de que este intervalo aleatorio contenga a la media poblacional es

Para una muestra particular de tamaño n, a partir de los valores estimados de 𝑋̅ y

de s2, un intervalo de confianza del 100(1-α) % para m es:

Si (𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 ) una muestra aleatoria de tamaño n de una v.a. X donde

Se hicieron 10 mediciones sobre la resistencia de cierto tipo de alambre que dieron