INVESTIGACIÓN
INVESTIGACIÓN
INVESTIGACIÓN
MISHELL ACOSTA
DAVID PILLAJO
JOSÉ JIMENEZ
Varianza Conocida……………………………………………………………….. 3
desconocida………………………………………………………………………. 6
población………………………………………………………………………… 22
población………………………………………………………………………… 24
media…………………………………………………………………………….. 28
D. Cálculo del tamaño de la muestra para contraste de hipótesis…………….. 30
X. Bibliografía………………………………………………………………………. 48
I. INTERVALO DE CONFIANZA PARA LA MEDIA
muestral 𝑋̅.
Por tanto,
̅ < 𝑔2 (𝜇)⌋ = 1 − 𝛼
𝑃⌊𝑔1 (𝜇) < 𝑋
de manera que
𝑔1 (𝜇)
𝛼
∫ 𝑓(𝑥̅ , 𝜇) 𝑑𝑥̅ =
−∞ 2
y
∞
𝛼
∫ 𝑓(𝑥̅ , 𝜇) 𝑑𝑥̅ =
𝑔2 (𝜇) 2
̅.
En donde f es la función de densidad de la distribución de muestreo de 𝑋
Dado que
𝜎
𝑋̅ → 𝑁 (𝜇; )
√𝑛
y, por tanto
𝑋̅ − 𝜇
𝑍= 𝜎
√𝑛
Pero
se sigue que
𝑔1 (𝜇) − 𝜇 𝑔2 (𝜇) − 𝜇
𝜎 = 𝑍𝛼⁄2 𝑦 𝜎 = 𝑍1−𝛼⁄
2
√𝑛 √𝑛
𝜎 𝜎
𝑃 [𝜇 − 𝑧1−𝛼⁄ < 𝑋̅ < 𝜇 + 𝑍1−𝛼⁄ ]=1−𝛼
2 √𝑛 2 √𝑛
𝜎 𝜎
𝑃 [𝑋̅ − 𝑍1−𝛼⁄ < 𝜇 < 𝑋̅ + 𝑍1−𝛼⁄ ]= 1−𝛼
2 √𝑛 2 √𝑛
Si se reemplaza la variable aleatoria por los datos calculados a partir de una muestra
EN CONSECUENCIA:
Si (𝑋1 , 𝑋2 , 𝑋3 , … , 𝑋𝑛 ) una muestra aleatoria de tamaño n de una v.a. X donde
𝑋~𝑁(𝜇, 𝜎 2 ), 𝜎 2 conocido, un intervalo de confianza para µ de nivel 1-α es
𝜎 𝜎
[𝑋̅ − 𝑍𝛼 , 𝑋̅ + 𝑍𝛼 ]
2 √𝑛 2 √𝑛
Ejemplo 1:
3250 𝑝𝑠𝑖.
compresión promedio.
Solución:
i”
0.05
ợ ợ
El intervalo para utilizar es: [𝑋̅ − 𝑧µ , 𝑋 + 𝑧µ [
2 √𝑛 2 √𝑛
Reemplazando:
√1000 √1000
[3250 − 1.96𝑋 , 3250 + 1.96𝑋 ] = [3250, 10773, 3267.89227]
√12 √12
Reemplazando:
√1000 √1000
[3250 − 2.58𝑋 , 3250 + 2.58𝑋 ] = [3226,44793, 3273.55207]
√12 √12
𝑋̅ − 𝜇
𝑇= 𝑠
√𝑛
∑𝑛𝑖=1(𝑋1 − 𝑋̅)2
2
𝑠 =
(𝑛 − 1)
𝑋̅ − 𝜇
𝑃 (−𝑡1−𝛼⁄ < < 𝑡1−𝛼⁄ ,𝑛−1 ) = 1 − 𝛼
2,𝑛−1 𝑆 2
√𝑛
de donde
𝑆 𝑆
𝑝 (𝑋̅ − 𝑡1−𝛼⁄ < 𝜇 < 𝑋̅ + 𝑡1−𝛼⁄ ) = 1−𝛼
2,𝑛−1 √𝑛 2,𝑛−1 √𝑛
de 1-α.
𝑆
𝑋̅ ± 𝑡1−𝛼⁄
2,𝑛−1 √𝑛
EN CONCECUENCIA:
Ejemplo 2:
valores
1 1
𝑥1 , 𝑥2 , … , 𝑥10 tales que 𝑋̅ = ∑10 𝑥 = 10,48 ohms y 𝑆 = √ ∑10 (𝑥 − 𝑥̅ )2 =
10 𝑖=1 𝑖 9 𝑖=1 𝑖
𝑆 𝑆
[𝑋̅ − 𝑧𝜇 , 𝑋̅ + 𝑧𝜇 ], pero su nivel es aproximadamente 1-α
2 √𝑛 2 √𝑛
experimento.
p̂.
𝑝(1 − 𝑝) 𝑝𝑞
𝐸𝐸𝑃 = √ =√
𝑛 𝑛
cuyos extremos son los cuantiles α/2 y 1 − α/2. Así se puede afirmar con una
confianza de 1 −α que:
𝑝̂ 𝑞̂
𝑝 = 𝑝̂ ± 𝑧1−𝛼⁄ √
2 𝑛
confianza.
Ejemplo 3:
Error estándar:
𝑝̂ (1 − 𝑝̂ )
√
𝑛
(0,6)(0,4)
√ = 0,0775
40
𝑝̂(1−𝑝̂)
I.C. 95% de p: 𝑝̂ ± 𝑧𝛼⁄2 √ = 0,60 ± (1,96)(0,0775)
𝑛
= 0,60 ± 0,152
Interpretación:
100 veces, el intervalo que hemos obtenido sería uno de los 95 que de hecho
qué esté sea uno de los 95 intervalos de cada 100 que incluyen a la proporción
dar el valor del parámetro p con una cierta precisión. La única forma de obtener la
Si en un principio no tenemos una idea sobre que valores puede tomar p, debemos
Ejemplo 4:
una idea sobre el posible resultado del mismo, se desea conocer el tamaño de
Como no se tiene una idea previa del posible resultado del referéndum, hay que
1 𝑧0,985 2 (0,25)(2,17)2
𝑁 ≥ ( )( ) =
4 0,001 0,012
= 11,773
Así para tener un resultado tan fiable, el número de personas a entrevistar es muy
DE MEDIAS
la distribución t.
1 1
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡𝑠𝑝 √ +
𝑛1 𝑛2
En donde:
2
𝑠1 2 (𝑛1 − 1) + 𝑠2 2 (𝑛2 − 1)
𝑠𝑝 =
𝑛1 + 𝑛2 − 2
Ejemplo 5:
Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio
esto permite que el agua ataque varias partes de una estructura de cemento. Al
la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase
Solución:
2
𝑠1 2 (𝑛1 − 1) + 𝑠2 2 (𝑛2 − 1)
𝑠𝑝 =
𝑛1 + 𝑛2 − 2
52 (10 − 1) + 42 (15 − 1)
=
10 + 15 − 2
= 19,52
1 1
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡𝑠𝑝 √ +
𝑛1 𝑛2
1 1
= (90 − 87) ± (2,069)(4,41)√ +
10 15
−0,72 ≤ 𝜇1 − 𝜇2 ≤ 6,72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente,
para este nivel confianza, no puede concluirse la existencia de una diferencia
entre las medias.
B. Intervalo de confianza para la diferencia de medias de dos
distribuciones normales, varianzas desconocidas pero
diferentes.
𝑠1 2 𝑠2 2
( + )
𝑛1 𝑛2
𝑉= 2 2
𝑠 2 𝑠 2
( 1 ) ( 2 )
𝑛1 𝑛2
+
(𝑛1 − 1) (𝑛2 − 1)
[ ] [ ]
𝑠1 2 𝑠2 2
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡 √ +
𝑛1 𝑛2
Ejemplos 6:
estaciones diferentes del río James. El ortofósforo se mide en miligramos por litro.
diferentes.
Solución:
Datos:
Estación 1 Estación 2
n1=15 n2=12
s1=3,07 s2=0,80
3,072 0,802
( + 12 )
15
𝑉= 2 2
3,072 0,802
( ) ( )
15 12
+
(15 − 1) (12 − 1)
[ ] [ ]
𝑉 = 16,3 ≈ 16
𝑠1 2 𝑠2 2
𝜇1 − 𝜇1 = (𝑥
̅1 − 𝑥
̅2 ) ± 𝑡 √ +
𝑛1 𝑛2
3,072 0,802
𝜇1 − 𝜇1 = (3,84 − 1,49) ± 2,120√ +
15 12
que se simplifica a:
0,60 ≤ 𝜇1 − 𝜇1 ≤ 4,10
Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10 miligramos
DE PROPORCIONES
sigue:
o de manera breve
Si el intervalo construido contiene al 0 (es decir que un límite sea negativo y el otro
positivo) se concluye que las dos proporciones de éxitos poblacionales son iguales.
𝑥1
𝑝̂1 =
𝑛1
23
=
220
= 0,1045
𝑥2
𝑝̂ 2 =
𝑛2
20
=
220
= 0,10
• Según la confianza el valor de Zα/2 será cómo sigue:
= −0,05344
= 0,06254
El intervalo va de -0.054 a 0.062 o de -5.4% hasta 6.2%. Note que el 0 (cero) este
estará en campo.
veces de cada 100 que se espera que los resultados se encuentren dentro
de un rango específico.
o si lo desconocemos
la población es la siguiente
𝑍𝑎 2 × 𝑝 × 𝑞
𝑛=
𝑑2
En donde
Z = nivel de confianza
Q = probabilidad de fracaso
del 95%, lo que indica que sería 1,96 al cuadrado, y cómo no sabemos la
probabilidad de que ocurra el evento, "p" y "q" sería 50%. Entre el margen de error
redondear.
Ejemplo 8:
Con un nivel de confianza del 95% (α= 0,05; Zα= 1,96), un error máximo admitido
del 8% (la amplitud del IC será 16) y un valor de prevalencia conocido por la
de modo que, para una mayor precisión (IC más estrecho), se necesitará un mayor
tamaño de la muestra.
B. CÁLCULO DEL TAMAÑO DE LA MUESTRA CONOCIENDO
EL TAMAÑO DE LA POBLACIÓN
La fórmula para calcular el tamaño de muestra cuando se conoce el tamaño de la
población es la siguiente:
𝑁 × 𝑍𝑎 2 × 𝑝 × 𝑞
𝑛=
𝑑2 × (𝑁 − 1) + 𝑍𝑎2 × 𝑝 × 𝑞
En donde
N = tamaño de la población
Z = nivel de confianza,
Q = probabilidad de fracaso
Una muestra demasiado grande dará lugar a la pérdida de valiosos recursos como
información confiable.
Ejemplo 9:
Supongamos que nos piden calcular el tamaño para una población de 543.098
será 1.96 (recuerda que el investigador asignó un nivel de confianza de 95%) y “e”
será de 3%. Y como nuestro ejemplo dice que se desconoce la probabilidad de que
Es mucho mejor tener a las personas adecuadas para contestar nuestra encuesta,
que tener una gran cantidad de personas equivocadas que no nos van a aportar la
nuestro objeto de estudio, no tiene que ver, en este caso, con el tamaño.
una manera aleatoria, por ejemplo, seleccionar a cada 5 miembros de una lista de
Una vez que tengas la muestra adecuada, hay que decidir el tamaño de la muestra
que desees estudiar. Cuanto más precisa quieres que sea, más grande debe ser el
tamaño.
Si el 90% de los encuestados respondió que “Sí”, mientras que el 10% no contestó
45-55.
Por lo regular el margen de error puede ser controlado eligiendo una muestra
400.000).
Cuando hacemos una investigación debemos tener cuidado con las decisiones que
𝑍𝑎2 ×𝐷𝐸2
𝑛=
𝑑2
Ejemplo 10:
determinado hospital?
Estableciendo un nivel de confianza del 95% y una precisión de 5 (la diferencia entre
de 20. Por lo que el número mínimo de mujeres que ha de estudiarse será de 62.
1.962 × 202
𝑛= = 62
52
Además, cuando se pretenda determinar el tamaño que debe tener una muestra,
hay que tener en consideración el tipo de muestreo. Casi todas las fórmulas que se
utilizan asumen que el muestreo es aleatorio, es decir, que todos los sujetos tienen
Generalmente, este valor está entre 1,5 y 3. Así, un valor igual a 2, por ejemplo, con
un muestreo estratificado, significa que para obtener la misma precisión habrá que
se deberán estudiar 400 (200 × 2). Otro aspecto que debe tenerse en cuenta es el
de las pérdidas que se prevén, es decir, los sujetos de los cuales no se tendrá
𝑛
𝑛𝑐 =
1 − 𝑝𝑒
96
𝑛𝑐 = = 120
1 − 0.20
diferencias entre los dos grupos, para lo que plantea un contraste de hipótesis, con
establece que no hay diferencias entre los dos grupos para la variable de interés;
con el estudio.
2
[𝑍𝑎 × √2𝑝(1 − 𝑝) + 𝑍𝑏 × √𝑝1(1 − 𝑝1) + 𝑝2(1 − 𝑝2)]
𝑛=
(𝑝1 − 𝑝2)2
Donde: Zα es el valor Z correspondiente al riesgo α fijado; Zβ es el valor Z
población.
conoce como hipótesis nula. Una hipótesis nula es siempre una de status quo o de
no diferencia.
la Prueba de hipótesis. Una parte muy útil de la estadística son las pruebas de
hipótesis
Para entender bien que es una prueba de hipótesis es necesario tener claros los
y estadístico de prueba.
una población
parámetro
siempre que se especifica una hipótesis nula también se debe especificar una
hipótesis alternativa o una que debe ser verdadera si se encuentra que la hipótesis
información de la muestra para decidir que es improbable que la hipótesis nula sea
Se utiliza una prueba de una muestra para probar una afirmación con respecto a
𝑋̅ − 𝜇
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝜎 ~𝑁(0,1)
√𝑛
poblacional):
• La variable X es normal
Usamos:
𝑋̅ − 𝜇
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = ~𝑡𝑛 − 1
𝑆
√𝑛
distribución)
Usamos:
𝑋̅ − 𝜇
𝑍𝑝𝑟𝑢𝑒𝑏𝑎 = 𝜎 ≈ 𝑁(0,1)
√𝑛
La distribución en este caso no es exactamente normal, sino aproximadamente
normal.
¿Por qué? Porque tenemos que usar el teorema central del límite para conocer la
Ejemplo 12:
de 1120 horas. Una muestra de 8 lámparas de la producción actual dio una duración
Solución
Datos:
𝜇 =1120
n=8
𝑋̅=1070
S=125
𝛼=0.05
H1: 𝜇 <1120
T de student con lectura en la tabla para área de 0,025 y con n - 1 igual 8 – 7 grados
valor negativo porque se trata de una prueba de hipótesis a cola izquierda como se
puede observar en la H1
𝑋̅ − 𝜇
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = ~𝑡𝑛 − 1
𝑆
√𝑛
1070 − 1120
𝑇𝑝𝑟𝑢𝑒𝑏𝑎 = = −1.131
125
√8
estándar para valores críticos. Quizá la única diferencia real entre las ambas radica
Ejemplo:
En un estudio se afirma que 3 de 10 estudiantes universitarios trabajan. Pruebe esta
afirma, si una muestra aleatoria de 600 estudiantes universitarios revela que 200 de
pequeñas denotan únicamente la variación casual producto del muestreo (se acepta
H0), en tanto que grandes diferencias significan lo contrario (se rechaza H0). El
muestras.
La hipótesis nula en una prueba de dos muestras es
Ejemplo:
18 están a favor, en tanto que del paralelo B están a favor 14. ¿Es posible concluir
con un nivel de significación de 0,05 que los estudiantes que están a favor de la
PROPORCIONES
probabilidad).
Por lo tanto el valor estadístico de prueba para este caso es la prueba ji cuadrado o
Como sucede con las distribuciones t y F, la distribución ji cuadrado tiene una forma
problema.
Para obtener un valor crítico (valor que deja un determinado porcentaje de área en
resolviendo.
Ejemplos ilustrativos:
0,05 se significación.
Solución:
Frecuencia 6 8 9 15 14 8
observada
Frecuencia 10 10 10 10 10 10
esperada
Solución:
X. BIBLIOGRAFÍA
Inferencial con Excel, Winstats y Graph, Primera Edición. Imprenta M & V, Ibarra,
Ecuador.
Económica y Social.
18 de febrero de 2021 en
https://www.academia.edu/34168638/Probabilidad_y_Estadistica_Walpole_My
ers
de Medellín.
• Martínez Almécija, A., Muñoz García, J., & Pascual Acosta, A. (2004). Tamaño
de Publicaciones.
Continental.
de 2021, de:
https://www.mate.unlp.edu.ar/practicas/117_12_12092016211213.pdf
de:http://www.juntadeandalucia.es/averroes/centrostic/14002996/helvia/aula/ar
chivos/repositorio/250/295/html/estadistica/intervalos.htm#uno
aragon.com/cursos/salud-publica/2014/pdf/M2T05.pdf
3.htm#:~:text=%2D%20Intervalo%20de%20confianza%2C%20por%20defecto,(
contraste%20de%20dos%20colas).
http://www.itchihuahua.edu.mx/academic/industrial/estadistica1/cap03d.html