F BS2 09 Estimacion
F BS2 09 Estimacion
F BS2 09 Estimacion
En control de calidad, por ejemplo, si se estudia la vida de un electrodoméstico, y para ello deben funcionar hasta
que se estropeen, es absurdo estudiar todos los electrodomésticos (población) pues nos quedamos sin fabricación,
por lo que es imprescindible seleccionar una muestra que sea representativa de la población.
Actividades propuestas
1. Señala en qué caso es más conveniente estudiar la población o una muestra:
a) El diámetro de los tornillos que fabrica una máquina diariamente.
b) La altura de un grupo de seis amigos.
2. Se puede leer el siguiente titular en el periódico que publica tu instituto: “La nota media de los alumnos de 2º de
Bachillerato de la Comunidad de Madrid es de 7’9”. ¿Cómo se ha llegado a esta conclusión? ¿Se ha estudiado a toda la
población? Si hubieran seleccionado para su cálculo solo a las mujeres, ¿sería representativo su valor?
Recuerda que:
La media muestral la representamos por x o por la letra m, y se define como: x = ∑i xi ni = ∑ k
xi f i
n i =1
n
∑ (xi − x )
2
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
168
Actividades propuestas
4. Los parámetros de una distribución son µ = 20 y desviación típica σ = 3. Se extrae una muestra de 400 individuos.
Calcula P(19’9 < x < 20’3).
1.5. Distribución de la media muestral
De una población se selecciona una muestra y se calcula su media x y su desviación típica, s.
Elegimos otras muestras de la misma población, y de cada una obtenemos su media y desviación típica.
¿Cómo es la distribución de esas medias? ¿Y de esas desviaciones típicas?
Las diferentes medias dan lugar a una variable aleatoria que la vamos a representar por X .
El Teorema Central del Límite nos garantiza que:
La media de la variable aleatoria X es la media poblacional µ. La desviación típica de la variable aleatoria X es σ ,
n
donde σ es la desviación típica poblacional y n es el tamaño de las muestras elegidas. Para valores de n suficientemente
grandes, (n ≥ 30) la distribución de X se aproxima a una normal: N(µ, σ ).
n
Esta afirmación es cierta, sea cual sea la distribución de la población de partida, tanto si es discreta como si es continua, tanto
si es normal (entonces se aproxima a esta normal para valores de n menores que 30) como si no lo es.
Actividad resuelta
Control de las medias muestrales: En el control de calidad de una fábrica de latas de atún, se envasan latas de
100 gramos con una desviación típica de 2 gramos. Se empaquetan en cajas de 50 latas. Calcula la probabilidad de
que la media de las latas de una caja sea menor que 99 gramos.
Los datos que nos dan son la media poblacional, µ = 100, la desviación típica poblacional, σ = 2, y el tamaño de la muestra, n
= 50.
Sabemos que la media muestral se distribuye según una N(µ, σ ) = N(100, 0’28). Vamos a recordar como calculábamos
n
esas probabilidades.
Queremos calcular P( x < 99).
Lo primero tipificamos para pasar a una distribución N(0, 1): P( x < 99) = P( z < 99 − 100 ) = P( z < −3'54) = 1 − P( z < 3'54)
0'28
Recuerda:
La distribución normal es simétrica, por eso en la tabla no aparecen valores negativos, pues los calculamos usando los
positivos. Buscamos en la tabla 3’54 y obtenemos que P(z < 3’54) = 0’9998.
P( x < 99) = 1 − P(z < 3’54) = 1 − 0’9998 = 0’0002, una probabilidad muy pequeña.
Actividad resuelta
Control de la suma: En el mismo ejemplo anterior determina la probabilidad de que un lote de 400 latas pese más
de 40100 gramos.
n
∑ xi n
Como la media muestral es igual a x = i =1 , entonces ∑ xi = nx , por lo que su distribución es una normal de media nµ y
n i =1
σ
desviación típica n = σ n : N(nµ, σ n ).
n
En nuestro caso N(nµ, σ n ) = N(400⋅100, 2 400 ) = N(40000, 40)
n 40100 − 40000
Queremos calcular P( ∑ xi > 40100) = P( z > ) = P( z > 2'5) = 1 − P( z < 2'5) = 1 − 0’9938 = 0’0062.
i =1 40
Unas 6 cajas de cada mil pesarán más de 40’1 kg.
Actividades propuestas
5. Los pesos de las ovejas de una cierta ganadería tienen una media de 50 kg con una desviación típica de 4. Elegimos al
azar una muestra aleatoria simple de 100 ovejas. A) Determina la probabilidad de que su media sea superior a 51 kg. B)
Sea inferior a 56 kg. C) Sea superior a 48 kg. D) Esté entre 48 kg y 52 kg.
6. Una población tiene una media µ = 400 y una desviación típica σ = 20. Extraemos una muestra de 1000 individuos. Halla
el intervalo característico, para una probabilidad de 0’95, de la media muestral. Lo mismo para una probabilidad del 0’99.
7. El peso de una población se estima que tiene de media µ = 70 kg y una desviación típica σ = 10. Se elige una muestra
aleatoria simple de 100 individuos y se pesan todos juntos. Calcula la probabilidad de que dicho peso sea superior a 7010
kg.
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
170
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
172
α α
φ(− z1− α / 2 ) = ; φ( z1− α / 2 ) = 1 −
0.40
f(z)
2 2
La siguiente figura ilustra la localización de estos valores z1-α/2 y −z1-α/2. 0.30
Sabemos que 1-α
n 0.20
∑ xi
i =1 σ x −µ
x= ; X: N (µ, ) ; Z: : N (0, 1)
n n σ 0.10
n
Se observa que el estadístico depende del parámetro µ que se va a estimar y
que su distribución de probabilidad (normal tipificada) es conocida y no depende de dicho parámetro.
Así pues, dado un nivel de confianza 1 − α = γ se buscan dos valores z1-α/2 y −z1-α/2 que verifiquen:
x −µ
P(− z α < ) < z α ) = 1− α
1− σ 1−
2 n 2
Llamamos z1-α/2 al valor de la N(0, 1) que deja un área a la derecha de valor α/2. Entonces, por la simetría de la distribución
normal, a la izquierda de −z1-α/2 quedará un área igual a α/2. Por tanto: P(− z α < Z < z α ) = 1 − α = γ
1− 1−
2 2
(Recuerda: Si (1 − α)⋅100 % = 95 %, entonces z1-α/2 = 1’96).
σ
P( x − µ < z α ⋅ ) = 1 − α
1− n
2
Una vez obtenida la media muestral determinamos, con un nivel de confianza 1 − α = γ el intervalo de confianza. La media
poblacional µ, puede pertenecer o no a dicho intervalo.
Por tanto, se obtiene para la media poblacional el intervalo al (1 − α)⋅100 % de confianza:
σ σ
µ∈ x − z α ⋅ , x+z α ⋅
1− n 1− n
2 2
Por último, es interesante recordar que el intervalo de confianza se interpreta de la siguiente manera: si tuviésemos un
número infinito de muestras de la población, y construyésemos con cada una un intervalo, entonces el 100·γ % de dichos
intervalos contendría al verdadero valor del parámetro μ. En la práctica, sólo tenemos una muestra, y por eso sólo podemos
construir un intervalo. No tiene entonces sentido interpretar el intervalo como la región en la que estará μ con probabilidad γ,
puesto que en el intervalo calculado, la media μ estará o no estará. Por eso, para expresar nuestra incertidumbre sobre si el
intervalo calculado con nuestra muestra contiene o no al parámetro μ emplearemos la expresión nivel de confianza.
Actividad resuelta
Si se puede realizar la hipótesis de que el consumo de combustible sigue una distribución normal, veamos el
intervalo de confianza para la media al 95 %, suponiendo conocida la varianza (igual a 7684’3 l2). Se recoge una
muestra aleatoria simple de tamaño 20, y se obtiene una media muestral de 3937’9 l.
Para un nivel de confianza del 95 % la tabla de la normal estándar nos dan que z1-α/2 = 1’96.
σ σ 87'66
x − z ⋅ , x+z α ⋅ = 3937'9 − 1'96 ⋅
87'66
, 3937'9 + 1'96 ⋅ = (3899'5, 3976'3) .
α
1− n 1− n 20 20
2 2
Actividad resuelta
El tiempo de renovación de un teléfono móvil, expresado en años, se puede aproximar mediante una distribución normal
con desviación típica 0’4 años. Se toma una muestra aleatoria simple de 100 usuarios y se obtiene una media muestral
igual a 1’5 años. Determínese un intervalo de confianza al 95 % para el tiempo medio de renovación de un teléfono móvil.
Buscamos en la tabla de la normal estándar y se obtiene que z1-α/2 = 1’96 para un nivel de confianza del 95 %. Conocemos la
desviación típica poblacional σ = 0’4, y la muestra nos da una media x = 1’5.
El intervalo de confianza pedido es:
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
173
x − z α ⋅ σ , x + z α ⋅ σ = 1'5 − 1'96 ⋅ 0'4 , 1'5 + 1'96 ⋅ 0'4 = (1'5 − 0'0784, 1'5 + 0'0784) = (1'4216, 1'5784)
1− n 1− n 100 100
2 2
Tenemos la confianza de que el 95 % de los casos la media poblacional pertenecerá al intervalo:
(1’4216, 1’5784).
Actividades propuestas
14. Determina un intervalo de confianza para la media poblacional con un nivel de confianza del 95 % de una población de
desviación típica conocida, σ = 2, si hemos escogido una muestra aleatoria simple de tamaño 400 y calculado la media
muestral que es 50’5.
15. Determina un intervalo de confianza para la media poblacional con un nivel de confianza del 98 % de una población de
desviación típica conocida, σ = 2, si hemos escogido una muestra aleatoria simple de tamaño 400 y calculado la media
muestral que es 50’5. Compara con el anterior intervalo de confianza.
16. Se ha tomado una muestra aleatoria simple de 16 pacientes y se ha anotado el número de días que han recibido
tratamiento para los trastornos del sueño que sufren. Los resultados han sido:
280; 285; 295; 330; 290; 350; 360; 320; 295; 310; 300; 305; 295; 280; 315; 305.
Se sabe que la duración, en días, del tratamiento se puede aproximar por una variable aleatoria con distribución normal
de media µ desconocida y desviación típica 34’5 días. Determina un intervalo de confianza con un nivel del 95 % para la
media poblacional.
2.4. Relación entre nivel de confianza, error admisible y tamaño de la muestra
σ σ
Hemos visto que P( x − µ < z α ⋅ ) = 1 − α , es decir, el (1 − α)⋅100 % de las muestras cumplen que: x − µ < z α ⋅
1− n 1− n
2 2
Definición:
σ
Se llama error máximo admisible al valor E = z α ⋅ .
1− n
2
Observa que depende del tamaño de la muestra y del nivel de confianza. Al aumentar el tamaño de la muestra disminuye el
error máximo admisible, y al aumentar el nivel de confianza también aumenta el error máximo admisible. Puedes comprobarlo
con la tabla de la normal estándar, y los niveles de confianza más usados:
z α
1−α α 1−
2
0’90 0’10 1’645
0’95 0’05 1’96
0’99 0’01 2’575
Si nos fijan el error máximo admisible, E, y el nivel de confianza 1 − α, podemos determinar el mínimo tamaño que debe tener
2
σ σ
la muestra simplemente despejando: E = z α ⋅ ⇒ n = z α ⋅ ⇒ n =z α ⋅ σ .
1− n 1− E 1− E
2 2 2
Observa que el tamaño de la muestra debe ser más grande cuanto menor sea el error máximo admisible:
Para estimaciones más precisas se debe aumentar el tamaño de la muestra.
Al aumentar el nivel de confianza 1 − α aumenta el tamaño de la muestra, luego:
Para aumentar el nivel de confianza se debe aumentar el tamaño de la muestra.
Actividad resuelta
¿Cuál es el número mínimo de estudiantes que debemos elegir de una población de σ = 2, para una muestra aleatoria
simple si el error mínimo admisible es de 0’1, y el nivel de confianza del 95 %?
2
σ 2
2
n ≥ z α ⋅ ⇒ n ≥ 1'96 ⋅ = 1536'64
1− E 0'1
2
La muestra debe tener al menos 1537 estudiantes.
Conocido el tamaño de la muestra y el error máximo admisible, despejando y buscando en la tabla, también podemos
determinar el nivel de confianza.
σ n
E=z α⋅ ⇒ z α = E⋅
1− n 1− σ
2 2
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
174
Actividad resuelta
El otorrino conoce que la desviación típica del tiempo de respuesta a un sonido es de un segundo. Desea estudiar
dicho tiempo de respuesta con un error máximo admisible de 0’1 haciendo un estudio con 100 pacientes: Determina
con qué nivel de confianza obtendrá el intervalo de confianza.
n 100
z α = E⋅ = 0'1 ⋅ =1
1− σ 1
2
Buscamos en la tabla: P( Z < z α ) = 1 − α ⇒ P( Z < 1) = 0'8413 , es decir que el nivel de confianza es del 84’13 %.
1−
2
Actividad resuelta
En la población de estudiantes de desviación típica σ = 2, se quiere pasar una prueba a 100 estudiantes para determinar
sus conocimientos de Matemáticas con un error mínimo del 0’5. ¿Cuál es el nivel de confianza obtenido?
n 100
z α = E⋅ = 0'5 ⋅ = 2'5
1− σ 2
2
Buscamos en la tabla: P( Z < z α ) = 1 − α ⇒ P( Z < 2'5) = 0'9938 , es decir que el nivel de confianza es del 99’38 %.
1−
2
Actividades propuestas
17. ¿Qué tamaño mínimo debe tener una muestra para que el error máximo cometido en la estimación de la media sea
menor de 0,1 unidades, con un nivel de confianza del 95 %, sabiendo que la desviación típica poblacional es conocida y
vale 4?
18. Determina el tamaño muestral mínimo necesario para que el valor absoluto de la diferencia entre la media muestral y la
media poblacional sea menor o igual a 0’02 años con un nivel de confianza del 90 % sabiendo que la población se
distribuye según una normal de desviación típica 0’4.
19. En el estudio anterior se toma una muestra de 49 individuos. Queremos que el error máximo admisible sea de 0’02. ¿Cuál
será el nivel de confianza?
El intervalo sobre el valor del parámetro, que se construirá utilizando las propiedades del estimador, se denomina intervalo de
confianza.
Cuanto más estrecho sea dicho intervalo, menos incertidumbre existirá sobre el verdadero valor del parámetro.
Además del concepto de confianza, que se acaba de analizar, en los intervalos aparecen los conceptos de
precisión y de amplitud.
La amplitud es, la diferencia entre los extremos del intervalo, es decir, tS(X) – tI(X).
Para una muestra concreta, la amplitud del intervalo construido a partir de ella será: tS(X0) – tI(X0).
La precisión es una forma de evaluar el grado de eficacia del intervalo, y está inversamente relacionado con el concepto de
amplitud. En principio será deseable que los intervalos construidos tengan la máxima precisión posible, aunque el tamaño
muestral siempre será una limitación, ya que si es muy pequeño, no se puede conseguir una precisión elevada.
Ya se ha dicho que entre precisión y amplitud existe una relación inversa: a mayor precisión deseada, menor ha de ser la
amplitud del intervalo construido. Por ello, en principio lo deseable es que el intervalo presente la menor amplitud posible.
Si se obtiene un intervalo a partir de una muestra de tamaño 100, ¿cómo puede mejorarse este intervalo?
Una posibilidad es aumentar la precisión. Pero para aumentar la precisión (lo que equivale a disminuir la amplitud),
manteniendo el tamaño muestral el único instrumento que existe es el nivel de confianza. Así, es necesario disminuir
la confianza (ya que la precisión ha mejorado). Es decir, si la confianza pasa del 99 % a ser, por ejemplo, del 95 %,
se puede obtener una amplitud menor.
Otra posibilidad es aumentar la confianza. En tal caso, de manera análoga, debería disminuirse la precisión (lo que
equivale a aumentar la amplitud).
Si existe la posibilidad de aumentar el tamaño muestral (es decir, si se puede disponer de más información, lo que supone una
situación mejor), se puede aumentar la precisión sin modificar la confianza o aumentar la confianza sin modificar la precisión.
Por ejemplo, si se aumenta el tamaño muestral a 200, se puede aumentar la precisión o aumentar la confianza del intervalo,
sin modificar la otra característica. Realmente, aumentando el tamaño muestral siempre mejorará el intervalo construido, pero
dicho aumento suele tener un coste. Por lo tanto, cuando se quiere construir un intervalo de confianza para un parámetro,
antes de obtener la muestra, puede ser interesante realizar un estudio previo para obtener el valor de n óptimo en términos de
relación coste-beneficio.
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
175
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
176
p (1 − p ) p (1 − p ) 1
90 % ⇒ p−z α ⋅ ,
p + z1− α ⋅ = − 1'645 ⋅ 0'034,
1
+ 1'645 ⋅ 0'034 = (0'111, 0'223) 909%
1−
2 n 2 n 90% 6 6 90%
Margen de error = 0’223 – 0’111 = 0’112.
Podemos interpretarlo como que habrá entre un 11 % y un 22 % de personas con gripe.
p (1 − p ) p (1 − p ) 1
99 % ⇒ p−z α ⋅ ,
p + z1− α ⋅ = − 2'58 ⋅ 0'034,
1
+ 2'58 ⋅ 0'034 = (0'079, 0'254) 99%
1−
2 n 2 n 99% 6 6 99%
Margen de error = 0’254 – 0’079 = 0’175.
Podemos interpretarlo como que habrá aproximadamente entre un 8 % y un 25 % de personas con gripe.
Observa que:
Al aumentar el nivel de confianza, aumenta la amplitud del intervalo y por lo tanto aumenta el margen de error.
Actividades propuestas
20. Determina el intervalo de confianza para la proporción de árboles enfermos en Madrid con un nivel de confianza del 95 %,
si se ha elegido una muestra aleatoria simple de 100 árboles de los que hay 20 enfermos.
21. Se quiere estudiar la proporción de estudiantes que hacen actividades extraescolares. Para ello se ha seleccionado una
muestra de 400 estudiantes de los cuales 100 hacen actividades extraescolares. Determina el intervalo de confianza para
la proporción con un nivel de confianza del 95 %.
2.6. Determinación del tamaño de la muestra para una proporción
Para determinar el tamaño partimos de dos situaciones diferentes
1. Que se conozca la media o la proporción poblaciones
2. Que no se conozca
Ya hemos determinado el tamaño de la muestra para la media poblacional, ahora veremos algún ejemplo para la proporción.
El procedimiento es el mismo que antes. La diferencia va a estar en despejar el tamaño pues vamos a tener una desigualdad
con raíces cuadradas. Como el tamaño buscado también es una desigualdad podremos simplificar esa desigualdad.
Veámoslo con unos ejemplos:
Actividad resuelta
¿Cuál debe ser el tamaño de la muestra en una población de 8 millones de votantes para conocer si tienen la intención de
votar a un determinado partido político con una probabilidad de acierto del 0’95 y un margen de error inferior a 0’02? Se
conoce la proporción poblacional: 35 %.
Utilizamos intervalos de confianza:
Es una distribución binomial, pues un votante o vota a dicho partido, o no lo vota.
Llamamos n al tamaño de la muestra, p al número de los que votarán al partido en la población, X a los que votan al partido
X
en la muestra: P(−0'02 ≤ − p ≤ 0'02) = P ((−0'02 + p ) ⋅ n ≤ X ≤ (0'02 + p ) ⋅ n) ≥ 0'95
n
En la distribución binomial tenemos que la media es np y la varianza npq = np(1−p). Pasamos de la distribución binomial a la
distribución normal, añadiendo 0’5 de la longitud de los intervalos:
X
P (−0'02 ≤ − p ≤ 0'02) = P (−0'02n + pn − 0'5 ≤ X ≤ 0'02n + pn + 0'5) ≥ 0'95
n
−0'02n − 0'5 X − np 0'02n + 0'5 0'02n + 0'5 0'02n + 0'5
Tipificamos: P( ≤ ≤ ) ≥ 0'95 ⇒ 2 P ( z ≤ ) − 1 ≥ 0'95 ⇒ P( z ≤ ) ≥ 0'975
np(1 − p) np(1 − p) np(1 − p) np(1 − p) np (1 − p )
Buscamos en la tabla de la normal estándar y obtenemos que
0'02n + 0'5
≥ 1'96 . (1)
np(1 − p)
La proporción es conocida p = 0’35, q = 0’65, 0'02n + 0'5 ≥ 1'96 np(1 − p) ⇒ 0'02n + 0'5 ≥ 1'96 n ⋅ 0'35 ⋅ 0'65
Podemos resolver la desigualdad pero también podemos simplificarla, pues se seguirá verificando para este caso (aunque no
en el otro sentido): 0'02n ≥ 1'96 n ⋅ 0'35 ⋅ 0'65
Elevamos al cuadrado y despejamos: n ≥ 2184’91 ⇒ n ≥2185.
Por tanto se debe pasar la encuesta a 2185 votantes o más.
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
177
Actividad resuelta
¿Cuál debe ser el tamaño de la muestra en una población de 8 millones de votantes para conocer si tienen la intención de
votar a un determinado partido político con una probabilidad de acierto del 0’95 y un margen de error inferior a 0’02? Se
desconoce la proporción poblacional.
Es el mismo problema anterior, pero desconocemos la proporción.
0'02n + 0'5
Partimos de la desigualdad (1): ≥ 1'96 ⇒ 0'02n + 0'5 ≥ 1'96 np(1 − p)
np(1 − p)
Donde tenemos dos variables n y p. Vamos a acotar p(1 – p). Dibujamos la parábola y = x(1 – x) que alcanza su valor
n
máximo, 1/4, para x = 1/2, por lo que p(1 – p) ≤ 1/4. Sustituimos este valor. 0'02n + 0'5 ≥ 1'96 np(1 − p) ≥ 1'96
4
Eliminamos 0’5 (para simplificar cálculos), elevamos al cuadrado, y obtenemos que: n ≥ 2401.
La encuesta debe de realizarse para más de 2401 votantes.
Hemos calculado el tamaño de la muestra con un margen de error no superior a 0’02 y una certeza del 95 %.
Actividades propuestas
22. ¿Cuántas veces se debe lanzar una moneda para que la proporción de caras no se aparte de la teórica, 1/2, más de una
centésima, con un grado de certeza no inferior al 95 %? ¿Cuántas, con el mismo margen de error y una certeza no
inferior al 99 %? ¿Lo mismo con 99’9 % de certeza? (Soluciones: n ≥ 9504, n ≥ 16412, n ≥ 26632)
Volvemos al problema de las encuestas de votos.
Actividad resuelta
En una población de 8 millones de votantes elegimos una muestra aleatoria de 2000 de la que 700 personas nos
afirman que van a votar a un determinado partido. ¿Qué podemos asegurar sobre el número de votos que recibirá
dicho partido?
Como 700/2000 = 35, una primera respuesta podría ser que 0’35⋅8000000 = 2800000 votos, pero ¿qué confianza podemos
tener de ese resultado.
Fijamos un nivel de significación α, o un grado de confianza, 1 − α = γ. Sea α = 0’05 y γ = 1 − α = 0’95.
Sea p la proporción de votantes al partido estudiado. Tenemos una distribución binomial de media µ = np = 2000⋅p y
σ = npq = 2000 ⋅ p(1 − p) . Calculamos la probabilidad de que el número de votantes al partido estudiado de la muestra
sea: P(µ − kσ ≤ X ≤ µ + kσ) ≥ 0’95.
Pasamos de la distribución binomial a la normal para calcular k y p: P(µ − kσ − 0’5 ≤ X ≤ µ + kσ + 0’5) ≥ 0’95
−kσ − 0'5 + kσ + 0'5 + kσ + 0'5
Tipificamos: P( ≤Z≤ ) ≥ 0’95. Obtenemos que z = ≥ 1’96, por lo que kσ + 0’5 ≥ 1’96σ.
σ σ σ
Debemos sustituir µ y α en función de p como se hizo anteriormente y se obtiene que: 0’3280 ≤ p ≤ 0’3719, es decir que la
proporción de votantes debe estar entre el 33 % y el 37 %.
Actividades propuestas
23. Rehaz los cálculos de la actividad anterior para un nivel de confianza del 99 %
24. Se investigan los hábitos de consumo de una población de dos millones de personas. Se pasa una encuesta a mil
personas y se les pregunta si en su domicilio se cocina con gas, de los que 600 responden afirmativamente. Qué puedes
afirmar sobre el número de personas en las que en su domicilio se usa gas con un nivel de confianza del 95 %.
3. CONTRASTE DE HIPÓTESIS
3.1. Test de hipótesis. Contraste de hipótesis para la proporción poblacional
Empecemos con un ejemplo.
Actividad resuelta
La probabilidad de curarse una enfermedad con un cierto medicamento es 0’68. Se investiga un nuevo medicamento
que queremos mejore el número de curaciones. Se tratan 200 enfermos de los que se curan 150. ¿Podemos estar
seguros de que el nuevo medicamento es mejor que el antiguo?
En primer lugar vamos a calcular la probabilidad de que con el primer medicamento se hubieran curado 150 enfermos.
Tenemos una distribución binomial de media µ = np = 200⋅0’68 = 136, y σ = npq = 200 ⋅ 0'68 ⋅ 0'32 = 43'52 = 6'6
Ajustamos la binomial con una normal, tipificamos y buscamos en la tabla:
150'5 − 136
𝑃𝑃(𝑧𝑧 ≥ = 2'2) = 1 − 𝑃𝑃(𝑧𝑧 < 2'2) = 1 − 0'9861 = 0'0139
6'6
La probabilidad ha salido muy pequeña. Rechazamos la hipótesis. Aunque es posible que sí hubiera con el primer
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
178
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
179
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
180
RESUMEN
Todos los individuos de la población tienen la misma Se numera la población y se usan
Muestra
probabilidad de ser elegidos en la muestra. números aleatorios para elegir la
aleatoria simple
muestra.
Error máximo
2 N(2, 1), 1 − α = 0’95; n = 100
σ σ
admisible. E=z α⋅ ⇒ n =z α ⋅ E = 1’96⋅(1/10) = 0’196.
1− n 1− E
Tamaño mínimo 2 2 Si E = 0’5 → n = (1’96⋅(1/0’5))2 ≈ 16
de la muestra
Intervalo de
p ⋅ (1 − p )
p ⋅ (1 − p ) Proporción:1/6. Muestra de tamaño
p ∈ p − z1−α / 2 ⋅ , p + z1−α / 2 ⋅
confianza para la n n n = 120. 1 − α = 0’95 → z1-α/2 =
γ
proporción 1’645; s = 0’034 → (0’111, 0’223)
EJERCICIOS Y PROBLEMAS
1. Utiliza las tablas de la normal estándar y comprueba las probabilidades siguientes:
a) P(z < 1) = 0’8413; b) P(z ≤ 0’7) = 0’7580; c) P(z > 1) = 1 − 0’8413 = 0’1587; d) P(z ≥ 1’86) = 0’0314;
e) P(−1’83 < z < −1) = 0’1251; f) P(z > 1’38) = 0’0838; g) P(−1’83 ≤ z < 0’75) = 0’7398.
2. Utiliza las tablas de la normal estándar para calcular las probabilidades siguientes:
a) P(z < 0’72); b) P(z ≤ 1’21); c) P(z > 0’93); d) P(z ≥ −1’86);
e) P(−1,02 < z < −0’85); f) P(0’65 < z < 1’42); g) P(1’76 > z > 0’72); h) P(−0’9 > z > −0’51).
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
181
3. Una variable aleatoria X sigue una distribución normal de media 5 y desviación típica 0’5. Calcula las siguientes
probabilidades:
a) P(X < 6); b) P(X ≤ 4); c) P(X > 3); d) P(X ≥ 5’5);
e) P(−3 < X < −1); f) P(X > 2); g) P(3 ≤ X < 7); h) P(6 > X > 2).
4. En un centro escolar hay 900 estudiantes, que son 600 de ESO y 300 de Bachillerato. Se quiere tomar una muestra
aleatoria por muestro estratificado proporcional de tamaño 50. ¿Cuántos estudiantes se deben escoger de forma aleatoria
de ESO y cuántos de bachillerato?
5. El número de megabytes (Mb) descargados mensualmente por un grupo de clientes de una compañía de telefonía móvil
se aproxima por una distribución normal con media 4 Mb y desviación típica igual a 1’5 Mb. Se toma una muestra
aleatoria simple de tamaño 64.
a) ¿Cuál es la probabilidad de que la media muestra sea inferior a 3’5 Mb?
b) ¿Sea superior a 4’5 Mb?
c) Se supone ahora que la media poblacional es desconocida y que la media muestra toma el valor 3’7 Mb. Obtén un
intervalo de confianza al 95 % para la media de la población. Obtén también un intervalo de confianza al 99 % para la
media de la población. ¿Es mayor o menos que el anterior? Explica este resultado
6. La duración en horas de un cierto tipo de bombillas de bajo consumo se puede aproximar por una distribución normal de
media µ y desviación típica igual a 3600 horas. Se toma una muestra aleatoria simple.
a) ¿Qué tamaño muestral se necesitaría como mínimo para que, con un nivel de confianza del 95 %, el valor absoluto
de la diferencia entre µ y la duración media observada X de esas bombillas sea inferior a 100 horas?
b) Si el tamaño de la muestra es 121 y la duración media observada X es de 4000 horas, obtén un intervalo de
confianza al 95 % para la media poblacional µ.
7. La longitud, en milímetros (mm), de los individuos de una determinada plantación de mejillones se puede aproximar por
una variable aleatoria con distribución normal de media desconocida µ y desviación típica igual a 3 mm.
a) Se toma una muestra aleatoria simple de 64 mejillones y se obtiene una media muestral igual a 70 mm. Determina un
intervalo de confianza para la media poblacional de la longitud de los mejillones con un nivel de confianza del 99 %.
Determina también un intervalo de confianza para la media poblacional de la longitud de los mejillones con un nivel
de confianza del 95 %.
b) Determina el tamaño muestral mínimo necesario para que el error máximo cometido en la estimación de µ por la
media muestral sea menor o igual que 5 mm con un nivel de confianza del 95 %.
8. El consumo mensual de leche (en litros) de los alumnos de un determinado colegio se puede aproximar por una variable
aleatoria con distribución normal de media µ y desviación típica σ = 3 litros.
a) Se toma una muestra aleatoria simple y se obtiene el intervalo de confianza (16; 20) para estimar µ, con un nivel de
confianza del 95 %. Calcula la media muestral y el tamaño de la muestra elegida.
b) Se toma una muestra aleatoria simple de tamaño 81. Calcula el error máximo cometido en la estimación de µ
mediante la media muestral con un nivel de confianza del 95 %.
9. El consumo familiar diario de electricidad (en kW) en cierta ciudad se puede aproximar por una variable aleatoria con
distribución normal de media µ = 6’3 kW y desviación típica 0’9 kW. Se toma una muestra aleatoria simple de tamaño
100. Calcula:
a) La probabilidad de que la media muestral esté comprendida entre 6 kW y 6’6 kW.
b) El nivel de confianza con el que se ha calculado el intervalo de confianza (6’1; 6’6) para la media del consumo familiar
diario.
10. Se ha tomado una muestra aleatoria simple de 9 pacientes y se ha anotado el número de días que han recibido
tratamiento para trastornos digestivos que sufren. Los resultados han sido:
100, 98, 75, 103, 84, 95, 105, 82, 107.
Se sabe que la duración, en días, del tratamiento se puede aproximar por una variable aleatoria con distribución normal
de media µ desconocida y desviación típica 9 días; a) Determina un intervalo de confianza con un nivel del 95 % para µ;
b) ¿Qué tamaño mínimo debe tener la muestra para que el error máximo cometido en la estimación de la media sea
menor de 5 días, con un nivel de confianza del 95 %?
11. El tiempo de renovación de un teléfono móvil, expresado en años, se puede aproximar mediante una distribución normal
con desviación típica 0’2 años.
a) Se toma una muestra aleatoria simple de 81 usuarios y se obtiene una media muestral igual a 1’8 años. Determina un
intervalo de confianza al 95 % para el tiempo medio de renovación de un teléfono móvil.
b) Determina el tamaño muestral mínimo necesario para que el valor absoluto de la diferencia entre la media muestral y la
media poblacional sea menor o igual a 0’03 años con un nivel de confianza del 95 %.
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
182
12. Se considera una variable aleatoria con distribución normal de media µ y desviación típica igual a 1’2. Se toma una
muestra aleatoria simple de 100 elementos.
a) Calcula la probabilidad de que el valor absoluto de la diferencia entre la media muestral y µ sea mayor o igual que 4.
b) Determina un intervalo de confianza del 90 % para µ; si la media muestral es igual a 50.
13. La estatura en centímetros (cm) de los varones mayores de edad de una determinada población se puede aproximar por
una variable aleatoria con distribución normal de media µ y desviación típica σ = 15 cm.
a) Se toma una muestra aleatoria simple de 100 individuos obteniéndose una media muestral x = 174 cm. Determina un
intervalo de confianza al 95 % para µ.
b) ¿Cuál es el mínimo tamaño muestral necesario para que el error máximo cometido en la estimación de µ por la media
muestral sea menor que 5 cm, con un nivel de confianza del 90 %?
14. El mínimo tamaño muestral necesario para estimar la media de una determinada característica de una población que
puede aproximarse por una variable aleatoria con distribución normal de desviación típica σ, con un error máximo de 2’27
y un nivel de confianza del 90 %, supera en 1000 unidades al que se necesitaría si el nivel de confianza fuera del 95 % y
el error máximo fuera de 5’23. Expresa los tamaños muestrales en función de la desviación típica σ y calcula la
desviación típica de la población y los tamaños muestrales respectivos.
AUTOEVALUACIÓN
1. Indica cuál de los siguientes motivos no es por el que se recurre a una muestra:
a) El proceso de medición es destructivo
b) La población es muy numerosa
c) La población es imposible o difícil de controlar
d) La población tiene mal carácter
2. Una ganadería tiene diez mil ovejas de diferentes razas. Queremos extraer una muestra de 100 ovejas. Indica el tipo
de muestreo más adecuado:
a) muestreo aleatorio sistemático b) muestreo aleatorio estratificado
c) muestreo no aleatorio d) muestreo aleatorio por conglomerados
3. Indica cuál de las siguientes afirmaciones es falsa en una distribución N(0, 1):
a) P(z < 0) = 1 b) P(z < 0) = 0’5 c) P(z = σ) = 0 d) P(z > 0) = 0’5.
4. De una población de media 69 y desviación típica 8 se toma una muestra de tamaño 12. La probabilidad de que un
individuo de la muestra tenga un valor mayor que 93 es:
a) P(x > 93) = 0’9987 b) P(x > 93) = 0’6501 c) P(x > 93) = 0’1293 d) P(x > 93) = 0’0013.
5. Los parámetros de una distribución son µ = 10 y desviación típica σ = 20. Se extrae una muestra de 100 individuos.
El valor de P(8 < x < 12) es:
a) P(z < 1) = 0’8416 b) 0’6838 c) 0’3168 d) 0’1584.
6. En el control de calidad de una fábrica de chocolate, se envasan tabletas de 100 gramos con una desviación típica de
2 gramos. Se toma una muestra de 50 tabletas. Calcula la probabilidad de que el peso medio de las tabletas sea
menor que 99 gramos:
a) 0’0002 b) 0’9998 c) 0’3541 d) 0’0023.
7. En el control de calidad de una envasadora de estuches de jamón, se envasan en estuches de 100 gramos con una
desviación típica de 2 gramos. La probabilidad de que un lote de 400 estuches pese más de 40100 gramos es de:
a) 0’9938 b) 0’0062 c) 0’0002 d) 0,9998
8. Determina un intervalo de confianza con un nivel de confianza del 0’95 de una N(2, 0’1):
a) P(1'8 < X < 2'2) = 0'95 b) P(1'9 < X < 2'1) = 0'95 c) P(1'8 < X < 2'2) = 0'99 d) P(1 < X < 2) = 0'90
9. Se ha elegido una muestra aleatoria simple de 1000 componentes y en ella se ha obtenido que la proporción de
defectuosos es del 3’7 %. Determina el intervalo de confianza al 99 % para la proporción de componentes
defectuosos que se producen en una fábrica:
a) (0’0371, 0’0375) b) (0’0258, 0’0351) c) (0’0216, 0’0524) d) (0’0111, 0’0222)
10. ¿Cuál debe ser el tamaño de la muestra en una población de 8 millones de votantes para conocer si tienen la
intención de votar a un determinado partido político con una probabilidad de acierto del 0’95 y un margen de error
inferior a 0’02?:
a) 2401 b) 1959 c)2502 d) 3026
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
183
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF
184
2º Bachillerato. Matemáticas Aplicadas a las Ciencias Sociales II. Capítulo 10: Estimación. Intervalos de confianza Autora: Raquel Caro
LibrosMareaVerde.tk Revisores: Leticia González Pascual y Álvaro Valdés Menéndez
www.apuntesmareaverde.org.es Ilustraciones: Banco de Imágenes de INTEF