Bloque Temático I: Probabilidad Y Estadística
Bloque Temático I: Probabilidad Y Estadística
Bloque Temático I: Probabilidad Y Estadística
PROBABILIDAD
Y
ESTADÍSTICA
1.- PROBABILIDAD
0.- Introducción
Muchos aspectos de nuestra vida están influidos por el azar. Nuestra constitución
física, por ejemplo, viene determinada por un agrupamiento impredecible de genes. De igual
forma, en el mundo que nos rodea pueden verse manifestaciones asociadas al azar: el tiempo
que hará en los días próximos, los resultados de determinados juegos y deportes, etc.
Desde tiempo inmemorial, tratamos de evaluar la posibilidad de que ocurra un suceso
particular cada vez que estudiamos un suceso asociado a un fenómeno o experimento que
todavía no se ha realizado y, por ello, hacemos un cálculo de su posibilidad.
Desde el siglo XVII, el cálculo de la probabilidad de un suceso ha sido una
preocupación seria de los matemáticos. De sus investigaciones, ininterrumpidas hasta hoy,
han surgido las diferentes formas de calcular las posibilidades de los sucesos particulares y de
las combinaciones de sucesos.
Ejemplo
Llamamos experimento compuesto, a aquel que está formado por varios experimentos
simples. Una técnica muy utilizada para calcular el espacio muestral de un experimento
compuesto es hacer un diagrama de árbol.
Ejemplo
Así, si tiramos una moneda dos veces, serían sucesos todos los siguientes:
1. Sale al menos una cara.
2. Salen más caras que cruces.
3. La moneda cae de canto.
4. No sale ninguna cruz.
Ejemplo
Ejercicio
Ejemplo
Sucesos elementales son los que están formados por un solo resultado del
experimento.
Ejemplo
Sucesos compuestos son los que están formados por dos o más resultados del
experimento; es decir, por dos o más sucesos elementales.
Ejemplo
Suceso seguro es el que se verifica siempre. Está formado por todos los
resultados posibles del experimento, por tanto, coincide con el espacio muestral, E.
Ejemplo
Ejemplo
Ejemplo
Ejercicios
12.- Una experiencia aleatoria consiste en preguntar a tres personas distintas, elegidas
al azar, si son partidarias o no de consumir un determinado producto.
a) Escribe el espacio muestral asociado a dicho experimento utilizando la
letra “s” para las respuestas afirmativas y la “n” para las negativas.
b) ¿Qué elementos del espacio muestral anterior constituyen el suceso “al
menos dos de las personas son partidarias de consumir el producto”.
c) Describe el suceso contrario de “más de una persona es partidaria de
consumir el producto”. Sol.: construir un diagrama de árbol
13.- Dado el suceso: “sacar al menos una cruz al tirar dos monedas”, calcular el
suceso contrario.
14.- Dado el suceso: “sacar oros al extraer una carta de una baraja” , calcular el
suceso contrario.
A E E A A A AC E
Ejemplos
A E A A A AC
Ejemplos
Ejercicio
20.- Tenemos una urna con nueve bolas numeradas del 1 al 9. Realizamos el
experimento, que consiste en sacar una bola de la urna, anotar el número y
devolverla a la urna. Consideramos los siguientes sucesos: A = “salir un
número primo” y B = “salir un número cuadrado”. Responde a las cuestiones
siguientes:
a) Calcula los sucesos A B y A B .
b) Los sucesos A y B, ¿son compatibles o incompatibles?
c) Encuentra los sucesos contrarios de A y de B.
( A B ) ( A B ) ( B A) A B A B A BC
Ejemplo
21.- Si C representa el suceso “ser copas” de una baraja de 40 cartas y F el
suceso “ser figura” (sota, caballo, rey), calcula C F .
Unión Intersección
Conmutativa A B B A A B B A
Asociativa A (B C ) ( A B) C A (B C ) ( A B) C
Distributiva A (B C ) ( A B) ( A C ) A (B C ) ( A B) ( A C )
Elemento neutro A A A E A
Además de estas sencillas propiedades, las operaciones con sucesos tienen otras dos
propiedades muy importantes, conocidas como leyes de De Morgan:
Ejemplo
Esta ley sólo es aplicable cuando los sucesos elementales son equiprobables, es decir,
tienen la misma probabilidad.
Los casos favorables son los elementos que componen el suceso A. Los casos posibles
son todos los resultados del experimento, es decir, todos los elementos del espacio muestral.
Según esto, la probabilidad de un suceso será siempre un valor comprendido entre 0 y
1: 0 P ( A) 1 . Nunca podrá haber más casos favorables que posibles. Y nunca podrá salir
un valor negativo ya que estamos contabilizando casos favorables y casos posibles (en el peor
de los casos tendremos cero casos favorables).
Ejemplos
Ejercicio resuelto
25.- De una urna que contiene 8 bolas rojas, 5 amarillas y 7 verdes se extrae una
bola al azar. Calcula la probabilidad de que la bola extraída sea:
a) roja; b) verde; c) amarilla
El espacio muestral en este caso sería: E = {R, V, A}, que consta sólo de tres elementos, pero
sería un poco ingenuo asignar las probabilidades mediante la regla de Laplace,
Fue el matemático ruso Kolmogorov (1903-1987) quién precisó este término y definió
la probabilidad basándose en unos principios tan claros y evidentes que son admitidos por
todos sin necesidad de demostración, son los axiomas de probabilidad.
Sea E el espacio muestral de un experimento aleatorio. Llamamos probabilidad a una
función, P, que asigna a cada suceso A un número real P(A), que cumple los siguientes
axiomas:
En esencia estos tres axiomas, indican que disponemos de una cantidad total de
probabilidad igual a 1 que hemos de repartir aditivamente entre los distintos sucesos.
Por tanto, a partir de ahora utilizaremos la siguiente definición de probabilidad:
número de elementos del conjunto A
P ( A)
número total de elementos
1. 0 P ( w i ) 1 i 1, 2, , n
2. P (w 1 ) P (w 2 ) P (w n ) 1
Ejercicio resuelto
luego P si es probabilidad.
P ( A) P ( A C ) 1 P ( A C ) 1 P ( A)
2. La probabilidad del suceso imposible, Ø, es cero. Puesto que los sucesos seguro e
C
imposible son contrarios, Ø = E , según la propiedad anterior:
P () P ( E C ) 1 P ( E ) 1 1 0 P () 0
P ( A B ) P ( A) P ( B ) P ( A B )
P ( A B C ) P ( A) P ( B ) P (C ) P ( A B ) P ( A C ) P ( B C ) P ( A B C )
A B P ( A) P ( B )
Ejemplos
P ( A C B C ) P ( A B) C 1 P ( A B)
Usaremos, de igual modo, una regla más, referente a la intersección de dos sucesos, en
los que uno de ellos se verifica y del otro se verifica su contrario
P ( A B C ) P ( A) P ( A B )
Ejemplos
37.- En una comarca hay dos periódicos: El Progresista y El Liberal. Se sabe que el
55% de las personas de esa comarca lee El Progresista (P), el 40% lee El
Liberal (L) y el 25% no lee ninguno de ellos. Calcula la probabilidad de que
elegida una persona al azar:
a) Lea algún periódico.
b) Lea los dos periódicos.
c) Lea sólo El progresista.
d) Lea sólo El Liberal.
e) Lea sólo un periódico.
Ejercicio resuelto
Ahora el suceso A no tiene una posibilidad entre 6 de ocurrir, sino una entre tres, es decir,
P(A) = 1/3
Esta es la idea de la probabilidad condicionada: la información obtenida, B, modifica la
probabilidad de A. Lo expresamos así: P(A/B) = 1/3
P ( A B)
P ( A / B) , siendo P(B) ≠ 0
P (B)
nº de sucesos elementales de A B
P ( A / B)
nº de sucesos elementales de B
Ejercicio resuelto
Si despejamos P ( A B ) , obtenemos:
P ( A B) P ( B) P ( A / B)
, expresión que recibe el nombre de probabilidad compuesta o del producto.
Ejemplo
Ejercicio
CP ( A B C ) P ( A) P ( A B )
P(A / B )
P (B C ) 1 P ( B)
O incluso, nos pueden pedir que calculemos la probabilidad del contrario de un suceso
A, sabiendo que se ha verificado el contrario de otro suceso B:
P ( A ( A B ))
P ( A / A B)
P ( A B)
en este caso, el enunciado del problema nos dirá que sabemos que se ha verificado uno de los
dos sucesos dados (por eso ponemos la unión de A y B como suceso conocido).
Ejemplos
42.- Sean A y B dos sucesos del mismo espacio muestral tales que P(A) = 0,7,
P(B) = 0,6 y P(A U B) = 0,9. Calcula P(A/B C), P(B/A C) y P(B C/A).
43.- En un experimento aleatorio se sabe que P ( A) 0,6 , P ( B ) 0,3 y
P ( A B ) 0,7 . Calcula P ( A / B ) y P (( A B ) / A) .
44.- En un curso, el porcentaje de aprobados en Lengua es del 65% y en Filosofía
del 50%. Se sabe que la probabilidad P ( F / L) 0,7 , siendo F y L los
sucesos “aprobar Filosofía” y “aprobar Lengua”, respectivamente.
a) Calcula P ( L / F ) .
b) Halla la probabilidad de no aprobar ninguna de las dos asignaturas.
Ejercicios
Las tablas de contingencia están formadas por celdas en las que pueden figurar
frecuencias absolutas, frecuencias relativas, porcentajes y probabilidades.
No es preciso que nos den todos los datos de la tabla, pues es posible construirlas
completando unas celdas a partir de otras.
A AC TOTAL
C
B P(A ∩ B) P(A ∩ B) P(B)
B C
P(A ∩ B ) P(A ∩ B ) P(B C)
C C C
En la formación del árbol se abrirán tantas ramas como resultados posibles tenga
el experimento, aunque en la práctica se puedan obviar algunas de dichas ramas,
que corresponden a resultados que no intervienen en el suceso cuya probabilidad
se busca.
Una vez formado el árbol, para calcular la probabilidad del suceso que representa
una de sus ramas se multiplican las probabilidades que aparecen a lo largo de
dicha rama.
P ( A B)
P ( B / A)
P ( A)
Debe tenerse en cuenta que para calcular la probabilidad de los sucesos que se
C C
obtienen como resultado de recorrer las ramas del diagrama de árbol: A y B, A y B , A y B
C C
o A y B , hay que multiplicar las probabilidades que se indican de las ramas recorridas.
P ( A B ) P ( A) P ( B / A)
para calcular las probabilidades de las intersecciones de sucesos que forman la tabla.
Ejemplos
47.- Una encuesta revela que el 35% de los habitantes de La Laguna, oyen la
cadena Ser, el 28% la Cope y el 10% ambas emisoras. Calcula la probabilidad
de que elegida una persona al azar:
a) Escuche alguna emisora.
b) No escuche ninguna.
c) Escuche sólo la Ser.
d) Escuche sólo la Cope.
e) Escuche sólo una emisora.
48.- Se extraen, sucesivamente, dos cartas de una baraja española. ¿Cuál es la
probabilidad de que la primera sea un rey y la segunda un as? ¿Y de obtener
dos reyes?
Ejercicios
Ejercicio resuelto
P(A) = P(sacar par) = 3/6 = 0,5, es decir que P(A/B) = P(A), y por tanto el conocer la
información B no modifica la probabilidad de A, diremos que los sucesos A y B son
independientes.
P ( A B ) P ( A) P ( B ) si A y B son independientes
Ejemplos
Ejercicios
P ( B) P ( B A 1 ) P ( B A 2 ) P ( B A n )
P ( B) P ( A 1 ) P ( B / A 1 ) P ( A 2 ) P ( B / A 2 ) P ( A n ) P ( B / A n )
Ejemplos
58.- Una compañía dedicada al transporte público explota tres líneas de una
ciudad, de forma que el 60% de los autobuses cubre el servicio de la
primera línea, el 30% cubre la segunda y el 10% cubre el servicio de la
tercera línea. Se sabe que la probabilidad de que, diariamente, un autobús
se averíe es del 2%, 4% y 1%, respectivamente, para cada línea. Determina
la probabilidad de que, en un día, un autobús sufra una avería.
59.- Tenemos dos urnas. La urna A, contiene 3 bolas verdes, 2 rojas y 1 negra; la
urna B, contiene 1 bola verde, 1 roja y 2 negras. La experiencia consiste en
extraer una bola de la urna A, introducirla en B, remover y extraer,
finalmente, una bola de la urna B. Calcula la probabilidad de que la segunda
bola extraída sea:
a) Roja
b) Verde
c) Negra
60.- Un ratón huye de un gato. Puede entrar por cada uno de los callejones, A, B
o C. En cada uno de ellos el gato puede alcanzarlo (+) o no. Se dan las
siguientes probabilidades: P (entre por A) = P (A) = 0,3; P (lo cace habiendo
entrado en A) = P (+/A) = 0,4; P (B) = 0,5; P (+/B) = 0,6; P (C) = 0,2; P (+/C) =
0,1. Calcular la probabilidad de que el gato cace al ratón.
61.- En cierta población, un 20% de los trabajadores lo hace en la agricultura
(A), un 25% en la industria (I) y el resto en el sector servicios (S). Un 63%
de los que trabajan en el campo son mayores de 45 años, siendo ese
porcentaje del 38% y 44% en los otros dos sectores. Seleccionado un
trabajador al azar, ¿qué probabilidad hay de que tenga menos de 45 años?
62.- Tenemos un dado y dos urnas. La urna I, contiene 6 bolas verdes, 3 rojas y 1
negra; la urna II, contiene 2 bolas verdes, 6 rojas y 2 negras. Si sale 1 o 2
extraemos una bola de la urna I, si sale 3, 4, 5 o 6 extraemos una bola de la
urna II. Hallar: P(R), P(V) y P(N).
Sean A1, A2, …, An , n sucesos incompatibles dos a dos (Ai ∩ Aj = Ø), cuya unión es
el espacio muestral E (A1 U …U An = E) tales que la probabilidad de cada uno de ellos es
distinta de cero, y sea B un suceso cualquiera del mismo espacio muestral, del que se conocen
las probabilidades condicionales P(B/Ai), entonces, según el teorema de Bayes, las
probabilidades P(Ai/B) viene dada por la expresión:
P ( Ai ) P (B / Ai ) P ( A i B)
P ( Ai / B)
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A n ) P ( B / A n ) P (B)
Ejemplos
Probabilidad condicionada
81.- Un 20% de los alumnos de un centro practican fútbol, un 15% baloncesto y
un 10% ambos deportes. Se elige un alumno al azar. Calcula la probabilidad
de que:
a) Practique baloncesto, sabiendo que practica fútbol.
b) Practique fútbol, sabiendo que no practica baloncesto.
82.- Sean A y B dos sucesos con P ( A) 0,5 , P ( B ) 0,3 y P ( A B ) 0,1 .
Calcula las siguientes probabilidades:
a) P ( A B ) c) P ( A /( A B ))
b) P ( A / B ) d) P ( A /( A B ))
a) Calcula P ( A B )
b) Halla P ( A)
c) Determina si A y B son independientes.
92.- En un espacio muestral se sabe que para dos sucesos A y B se verifica
P ( A B ) 0,1 ; P ( A C B C ) 0, 6 ; P ( A / B ) 0,5 .
a) Calcula P ( B ) .
b) Calcula P ( A B ) .
c) ¿Son A y B independientes?
93.- Sean C y D dos sucesos de un mismo espacio muestral. Sabiendo que
P (C ) 0,3 , que P ( D) 0,8 y que C y D son independientes, determina
P (C D) . ¿Son C C y D C independientes?
94.- A y B son dos sucesos independientes de un mismo experimento aleatorio,
tales que P ( A) 0, 4 ; P ( B ) 0,6 .
a) Calcula P ( A B ) y P ( A B ) .
b) Calcula P ( A / B ) y P ( B / A C ) .
120.- Un examen consiste en elegir al azar dos temas de entre los diez del
programa y desarrollar uno de ellos.
a) Un alumno sabe 6 temas. ¿Qué probabilidad tiene de aprobar el examen?
b) ¿Qué probabilidad tiene el mismo alumno de saberse uno de los temas
elegidos y el otro no?
121.- Un estudiante hace dos pruebas en un mismo día. La probabilidad de que
pase la primera prueba, es 0,6. La probabilidad de que pase la segunda es
0,8 y la de que pase ambas es 0,5. Se pide:
a) Probabilidad de que pase al menos una prueba.
b) Probabilidad de que no pase ninguna prueba.
c) ¿Son las dos pruebas sucesos independientes?
d) Probabilidad de que pase la segunda prueba en caso de no haber
superado la primera.
122.- Elegido un individuo al azar y observado por rayos X, se diagnosticó que
estaba tuberculoso. La probabilidad de que en la población de la que se eligió
el individuo uno de ellos sea tuberculoso es de 0,01. La probabilidad de que
un aparato de rayos X detecte que un individuo es tuberculoso siéndolo es
0,97 y no siéndolo es de 0,001. ¿Qué podemos decir acerca del diagnóstico?
(¿Qué probabilidad tiene de ser tuberculoso habiendo sido detectado?)
Probabilidad de la unión de
P ( A B ) P ( A) P ( B ) P ( A B )
sucesos compatibles
P ( A C B C ) P ( A B) C 1 P ( A B)
Leyes de De Morgan
P ( A C B C ) P ( A B) C 1 P ( A B)
Ocurrencia de un suceso y
el contrario de otro
P ( A B C ) P ( A) P ( A B )
P ( A B)
Probabilidad condicionada P ( A / B)
P (B)
P ( A B C ) P ( A) P ( A B )
P(A / B C )
Probabilidad condicionada, P (B C ) 1 P ( B)
cumpliéndose el contrario de
un suceso C P ( A C B C ) 1 P ( A B)
C
P(A / B )
P(B C ) 1 P ( B)
Probabilidad condicionada, P ( A ( A B ))
cumpliéndose la unión de dos P ( A / A B)
sucesos P ( A B)
Probabilidad compuesta o
P ( A B) P ( B) P ( A / B)
del producto
P ( A / B ) P ( A)
Probabilidad de sucesos
independientes P ( A B ) P ( A) P ( B )
Teorema de probabilidad P ( B ) P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A n ) P ( B / A n )
total
P ( Ai ) P (B / Ai )
Teorema de Bayes P ( A i / B)
P ( A1 ) P ( B / A1 ) P ( A 2 ) P ( B / A 2 ) P ( A n ) P ( B / A n )
0.- Introducción
Inferir: sacar una consecuencia de una cosa. Sacar consecuencia o deducir una cosa de
otra.
Puede decirse que la Estadística es la ciencia que trata de la recogida de datos, su
organización y análisis, así como de las predicciones que, a partir de estos datos, pueden
hacerse. Los aspectos anteriores hacen que pueda hablarse de dos tipos de estadística:
Descriptiva e Inferencial.
La Estadística Descriptiva se ocupa de tomar los datos de un conjunto dado,
organizarlos en tablas o representaciones gráficas y del cálculo de unos números que nos
informen de manera global del conjunto estudiado. Es aquí donde tiene sentido calcular la
media, mediana, moda, desviación típica, etc.
Ejemplos resueltos
1.- Los 13840 estudiantes de una universidad forman una población. Cada uno
de ellos es un individuo.
Se pueden analizar múltiples caracteres: sexo, nº de años que ha estado matriculado,
edad, estatura, …
Las variables correspondientes son, respectivamente, cualitativa, cuantitativa discreta
y cuantitativas continuas las dos últimas.
2.- Sea la población del alumnado de bachillerato de España. En dicha población
se puede estudiar:
Caracteres Valores
Cualitativo El deporte practicado Baloncesto, natación, …
Discreto El nº de libros que leen al año 0, 1, 2, 3, …
Cuantitativo
Continuo La estatura 160 cm, 170 cm, …
fi
hi
N
La tabla de frecuencias de una variable cuantitativa discreta sería, p.e.:
xi fi hi
0 4 0,118
1 14 0,412
… … …
N 1
Ejemplo resuelto
4.- Lanzamos dos dados, sumamos las puntuaciones y anotamos los resultados.
Repetimos la experiencia 30 veces:
11, 8, 9, 9, 3 4, 11, 7, 7, 8 7, 5, 6, 4, 4
7, 10, 2, 6, 10 7, 7, 6, 2, 8 7, 5, 8, 6, 9
Confecciona una tabla de frecuencias.
Para las variables cuantitativas continuas, y para las discretas cuando el número
de valores de la variable es muy elevado, utilizaremos la llamada tabla o
distribución de frecuencias, agrupando los valores en intervalos de igual longitud
o clases. El punto medio del intervalo se llama marca de clase, xi , y se calcula
como la semisuma de los extremos del intervalo. Es el valor que representa a todo
el intervalo para el cálculo de algunos parámetros. Sólo en el caso de que existan
valores muy dispersos tomamos distintas amplitudes. Una vez que se han elegido
las clases, la distribución de frecuencias se construye igual que para una variable
discreta.
[m, M) xi fi hi
[L0 – L1) (L0 + L1)/2
R R
E inf m
2
Ejemplo
x1 x 2 x n
i
x
x
N N
Si los datos vienen agrupados en una tabla de frecuencias, la expresión
de la media es:
x1 f 1 x 2 f 2 x n f n
i i
x f
x
f1 f 2 f n fi
La media es el centro de gravedad de la distribución. Es decir, si las barras
tuvieran peso, la media es el punto donde habría que sostener la tablilla en que se
sitúan. No es representativa si hay valores muy alejados respecto de ella.
Los parámetros de dispersión nos informan sobre cuánto se alejan del centro
los valores de la distribución. Entre ellos estarían:
2 ( x i x) 2 f i 2 xi 2 fi
s ; o bien: s x2
fi fi
s s2
Tanto la varianza como la desviación típica nos indican como de alejados de
la media se encuentran los datos, de tal manera que cuanto menores son estos
dos parámetros, más agrupados se encuentran los valores de la distribución en
torno a los valores centrales.
En ambas clases, la nota media es, aproximadamente, 6. Pero podemos observar que,
aun teniendo la misma media, estas distribuciones son muy distintas. Esta diferencia
nos la indica la desviación típica. En 3º B los datos están más alejados de la media: hay
muchas notas bajas (1, 2) y muchas altas (8, 9, 10), por esta razón la desviación típica
es mayor que en 3º A, donde la mayor parte de las notas son intermedias (5, 6, 7).
7.- Las calificaciones en la asignatura Matemáticas de los 40 alumnos de una
clase vienen dadas por la siguiente tabla:
Calificaciones 1 2 3 4 5 6 7 8 9
Número de alumnos 2 2 4 5 8 9 3 4 3
Hallar la calificación media, la varianza y la desviación típica.
xi fi xi f i xi2fi Para resolverlo, los cálculos se disponen como en la tabla
1 2 2 2 del margen:
2 2 4 8 212
Media: x 5,3
3 4 12 36 40
4 5 20 80 1296
Varianza: s 2 5, 3 2 4, 31
5 8 40 200 40
6 9 54 324
Desviación típica: s 4,31 2, 08
7 3 21 147
8 4 32 256
9 3 27 243
40 212 1296
Ejercicios
O sea, para hablar de variable aleatoria, nuestro experimento tiene que ser de tal
forma que cada posible resultado se pueda expresar mediante un número.
Serían variables aleatorias, p.e.:
Sacar una bola de una urna que contiene bolas blancas, negras y rojas
Elegir al azar una persona que le guste el cine.
Estos últimos ejemplos podemos plantearlos de otra forma para que fueran variables
aleatorias. Por ejemplo, si asignamos al suceso “le gusta el cine” el valor 1 y al suceso “no le
gusta el cine” el valor 0, ya tendríamos definida una variable aleatoria sobre el experimento
elegir una persona, que valdría 1 si le gusta el cine y 0 si no le gusta.
Las variables aleatorias las representamos con los mismos gráficos que las variables
estadísticas y podemos calcular los mismos parámetros.
La diferencia estribará en que en las variables estadísticas miramos las frecuencias
(absolutas o relativas) y en las variables aleatorias miraremos las probabilidades de
ocurrencia de cada suceso.
Dependiendo del tipo de variable aleatoria, estas distribuciones podrán ser discretas o
continuas.
Una de las distribuciones de probabilidad discretas más utilizada en la práctica es la
distribución binomial o de Bernoulli.
Entre las variables aleatorias continuas vamos a mostrar una distribución que se
ajusta a un gran número de variables de nuestro entorno: la distribución normal o de Gauss.
Los parámetros de una distribución de probabilidad tienen el mismo significado que
los de una distribución estadística, aunque conviene distinguirlos, de modo que la media, la
2
varianza y la desviación típica se representarán mediante los símbolos: , y .
f ( x i ) P( X x i ) p i
xi x1 x2 x3 … xn
f(xi) = P (X = xi) = pi p1 p2 p3 … pn
Ejemplo resuelto
xi 0 1 2 3
pi = P (X = xi) 1/8 3/8 3/8 1/8
Ejemplo resuelto
2
Es una función de probabilidad continua, simétrica, respecto
de la recta vertical x =
Como f(x) es una función de densidad, el área comprendida entre el eje X y la curva es
uno, y se distribuye en intervalos de la forma siguiente:
Caso general: a 0, P (Z a) = P (Z a)
Ejemplo
Ejercicios
P (Z a) = 1 P (Z a)
Ejemplo
Ejercicio
Ejemplo
Ejercicio
P (Z a) = P (Z a)
Ejemplo
Ejercicio
P (a Z b) = P (Z b) P (Z a)
Ejemplo
Ejercicio
X
Z
Con lo cual, el cálculo de probabilidades se reduce a:
k
P(X k) P Z
Ejemplo
Ejercicio
Ejemplo
Ejercicio
27.- Se sabe que, en una ciudad, el peso de las personas mayores de 18 años se
distribuye normalmente con una media de 72 kg y una desviación típica de 6
kg. Calcula la probabilidad de que, tomada una persona al azar, pese más de
80 kg.
n
P (obtener r éxitos ) P ( X r ) p r q n r
r
Esta expresión se denomina función de probabilidad de una distribución binomial.
Estas variables aleatorias son discretas ya que pueden tomar los valores 0, 1, 2, …, n,
en las situaciones de n experiencias.
n
La expresión recibe el nombre de número combinatorio de n sobre r y sirve para
r
calcular el número de combinaciones de n elementos tomados de r en r. Se define:
n n! n n
C n, r n 1; 0 1
r r ! (n r )!
Ejemplo resuelto
Ejercicio
Desviación típica: n p q
Nota: Dado que por mucho que se parezca nunca es igual una binomial que una
normal, sería necesario aplicar en el cálculo de probabilidades un ajuste que recibe el
nombre de corrección de Yates. No obstante, para simplificar el proceso se deja de lado esta
diferencia y se calcularán las probabilidades directamente en la curva normal.
Ejemplo resuelto
12,5 10
P( X 12, 5) P Z P( Z 0,83) 0, 2033
3
Ejercicios
36.- En una fábrica de golosinas se producen palotes de regaliz con una longitud
media de 66 mm y una desviación típica de 8 mm.
a) ¿Qué probabilidad hay de encontrar un palote con una longitud inferior a
70 mm?
b) ¿Qué probabilidad hay de encontrar un palote con una longitud mayor de
80 mm?
c) ¿Qué probabilidad hay de encontrar un palote cuya longitud cuya
longitud esté comprendida entre 66 y 74 mm?
d) Hemos comprado una caja con 400 palotes, ¿cuántos aproximadamente
medirán más de 80 mm?
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4,0 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
3 0 0,9703 0,8574 0,7290 0,6141 0,5120 0,4219 0,3430 0,2963 0,2746 0,2160 0,1664 0,1327 0,1250
1 0,0294 0,1354 0,2430 0,3251 0,3840 0,4219 0,4410 0,4444 0,4436 0,4320 0,4084 0,3823 0,3750
2 0,0003 0,0071 0,0270 0,0574 0,0960 0,1406 0,1890 0,2222 0,2389 0,2880 0,3341 0,3674 0,3750
3 0,0000 0,0001 0,0010 0,0034 0,0080 0,0156 0,0270 0,0370 0,0429 0,0640 0,0911 0,1176 0,1250
4 0 0,9606 0,8145 0,6561 0,5220 0,4096 0,3164 0,2401 0,1975 0,1785 0,1296 0,0915 0,0677 0,0625
1 0,0388 0,1715 0,2916 0,3685 0,4096 0,4219 0,4116 0,3951 0,3845 0,3456 0,2995 0,2600 0,2500
2 0,0006 0,0135 0,0486 0,0975 0,1636 0,2109 0,2646 0,2963 0,3105 0,3456 0,3675 0,3747 0,3750
3 0,0000 0,0005 0,0036 0,0115 0,0256 0,4609 0,0756 0,0988 0,1115 0,1536 0,2005 0,2400 0,2500
4 0,0000 0,0000 0,0001 0,0005 0,0016 0,0039 0,0081 0,0123 0,0150 0,0256 0,0410 0,0576 0,0625
5 0 0,9510 0,7738 0,5905 0,4437 0,3277 0,2373 0,1681 0,1317 0,1160 0,0778 0,0503 0,0345 0,0312
1 0,0480 0,2036 0,3280 0,3915 0,4096 0,3855 0,3602 0,3292 0,3124 0,2592 0,2059 0,1657 0,1562
2 0,0010 0,0214 0,0729 0,1382 0,2048 0,2637 0,3087 0,3292 0,3364 0,3456 0,3369 0,3185 0,3125
3 0,0000 0,0011 0,0081 0,0244 0,0512 0,0879 0,1323 0,1646 0,1811 0,2304 0,2757 0,3060 0,3125
4 0,0000 0,0000 0,0004 0,0022 0,0064 0,0146 0,0284 0,0412 0,0488 0,0768 0,1128 0,1470 0,1562
5 0,0000 0,0000 0,0000 0,0001 0,0003 0,0010 0,0024 0,0041 0,0053 0,0102 0,0185 0,0283 0,0312
6 0 0,9415 0,7351 0,5314 0,3771 0,2621 0,1780 0,1176 0,0878 0,0754 0,0467 0,0277 0,0176 0,0156
1 0,0571 0,2321 0,3543 0,3993 0,3932 0,3560 0,3025 0,2634 0,2437 0,1866 0,1359 0,1014 0,0938
2 0,0014 0,0305 0,0984 0,1762 0,2458 0,2966 0,3241 0,3292 0,3280 0,3110 0,2780 0,2437 0,2344
3 0,0000 0,0021 0,0146 0,0415 0,0819 0,1318 0,1852 0,2195 0,2355 0,2765 0,3032 0,3121 0,3125
4 0,0000 0,0001 0,0012 0,0055 0,0154 0,0330 0,0595 0,0823 0,0951 0,1382 0,1861 0,2249 0,2344
5 0,0000 0,0000 0,0001 0,0004 0,0015 0,0044 0,0102 0,0165 0,0205 0,0369 0,0609 0,0864 0,0938
6 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0007 0,0014 0,0018 0,0041 0,0083 0,0139 0,0156
7 0 0,9321 0,6983 0,4783 0,3206 0,2097 0,1335 0,0824 0,0585 0,0490 0,0280 0,0152 0,0090 0,0078
1 0,0659 0,2573 0,3720 0,3960 0,3670 0,3115 0,2471 0,2048 0,1848 0,1306 0,0872 0,0603 0,0574
2 0,0020 0,0406 0,1240 0,2097 0,2753 0,3115 0,3177 0,3073 0,2985 0,2613 0,2140 0,1740 0,1641
3 0,0000 0,0036 0,0230 0,0617 0,1147 0,1730 0,2269 0,2561 0,2679 0,2903 0,2918 0,2786 0,2734
4 0,0000 0,0002 0,0026 0,0109 0,0287 0,0577 0,0972 0,1280 0,1442 0,1935 0,2388 0,2676 0,2734
5 0,0000 0,0000 0,0002 0,0012 0,0043 0,0115 0,0250 0,0384 0,0466 0,0774 0,1172 0,1543 0,1641
6 0,0000 0,0000 0,0000 0,0001 0,0004 0,0013 0,0036 0,0064 0,0084 0,0172 0,0320 0,0494 0,0547
7 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0005 0,0006 0,0016 0,0037 0,0068 0,0078
8 0 0,9227 0,6634 0,4305 0,2725 0,1678 0,1001 0,0576 0,0390 0,0319 0,0168 0,0084 0,0046 0,0039
1 0,0746 0,2793 0,3826 0,3847 0,3355 0,2670 0,1977 0,1561 0,1373 0,0896 0,0548 0,0352 0,0312
2 0,0026 0,0515 0,1488 0,2376 0,2936 0,3115 0,2965 0,2731 0,2587 0,2090 0,1569 0,1183 0,1094
3 0,0001 0,0054 0,0331 0,0839 0,1468 0,2076 0,2541 0,2731 0,2786 0,2787 0,2568 0,2273 0,2188
4 0,0000 0,0004 0,0046 0,0185 0,0459 0,0865 0,1361 0,1707 0,1875 0,2322 0,2627 0,2730 0,2734
5 0,0000 0,0000 0,0004 0,0026 0,0092 0,0231 0,0467 0,0683 0,0808 0,1239 0,1719 0,2098 0,2188
6 0,0000 0,0000 0,0000 0,0002 0,0011 0,0038 0,0100 0,0171 0,0217 0,0413 0,0703 0,1008 0,1094
7 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0012 0,0024 0,0033 0,0079 0,0164 0,0277 0,0312
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0002 0,0002 0,0007 0,0017 0,0033 0,0039
9 0 0,9135 0,6302 0,3874 0,2316 0,1342 0,0751 0,0404 0,0260 0,0207 0,0101 0,0046 0,0023 0,0020
1 0,0830 0,2985 0,3874 0,3679 0,3020 0,2253 0,1556 0,1171 0,1004 0,0605 0,0339 0,0202 0,0176
2 0,0034 0,0629 0,1722 0,2597 0,3020 0,3003 0,2688 0,2341 0,2162 0,1612 0,1110 0,0776 0,0703
3 0,0001 0,0077 0,0446 0,1069 0,1762 0,2336 0,2668 0,2731 0,2716 0,2508 0,2119 0,1739 0,1641
4 0,0000 0,0006 0,0074 0,0283 0,0661 0,1168 0,1715 0,2048 0,2194 0,2508 0,2600 0,2506 0,2461
5 0,0000 0,0000 0,0008 0,0050 0,0165 0,0389 0,0735 0,1024 0,1181 0,1672 0,2128 0,2408 0,2461
6 0,0000 0,0000 0,0001 0,0006 0,0028 0,0087 0,0210 0,0341 0,0424 0,0743 0,1160 0,1542 0,1641
7 0,0000 0,0000 0,0000 0,0000 0,0003 0,0012 0,0039 0,0073 0,0098 0,0212 0,0407 0,0635 0,0703
8 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0009 0,0013 0,0035 0,0083 0,0153 0,0176
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0001 0,0003 0,0008 0,0016 0,0020
10 0 0,9044 0,5987 0,3487 0,1969 0,1074 0,0563 0,0282 0,0173 0,0135 0,0060 0,0025 0,0012 0,0010
1 0,0914 0,3151 0,3874 0,3474 0,2684 0,1877 0,1211 0,0867 0,0725 0,0403 0,0207 0,0114 0,0098
2 0,0042 0,0746 0,1937 0,2759 0,3020 0,2816 0,2335 0,1951 0,1757 0,1209 0,0763 0,0495 0,0439
3 0,0001 0,0105 0,0574 0,1298 0,2013 0,2503 0,2668 0,2601 0,2522 0,2150 0,1665 0,1267 0,1172
4 0,0000 0,0010 0,0112 0,0401 0,0881 0,1460 0,2001 0,2276 0,2377 0,2508 0,2384 0,2130 0,2051
5 0,0000 0,0001 0,0015 0,0085 0,0264 0,0584 0,1029 0,1366 0,1536 0,2007 0,2340 0,2456 0,2461
6 0,0000 0,0000 0,0001 0,0012 0,0055 0,0162 0,0368 0,0596 0,0689 0,1115 0,1596 0,1966 0,2051
7 0,0000 0,0000 0,0000 0,0001 0,0008 0,0031 0,0090 0,0163 0,0212 0,0425 0,0746 0,1080 0,1172
8 0,0000 0,0000 0,0000 0,0000 0,0001 0,0004 0,0014 0,0030 0,0043 0,0106 0,0229 0,0389 0,0439
9 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0005 0,0016 0,0042 0,0083 0,0098
10 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0000 0,0001 0,0003 0,0008 0,0010
0.- Introducción
Para comenzar el tema es conveniente recordar el significado de algunos términos:
Población es el conjunto de elementos sobre los que se hace un determinado
estudio.
Muestra es la parte de la población que tomamos para hacer el estudio.
Frecuentemente no es posible estudiar todos los elementos de una población por
razones de tiempo, economía (si hacemos un estudio sobre la fecha de caducidad de todos los
productos, ¿qué vendemos luego?), inexistencia real o porque el estudio requiere su
destrucción, por esto lo que nos interesa es tomar una muestra y deducir o inferir las
características de la población a partir de las de la muestra.
La Estadística Inferencial se ocupa de deducir o inferir las características de la
población a partir de las de la muestra.
Que la muestra de estudio sea lo más pequeña posible es una exigencia de tiempo y de
costes; además, el aumento de datos no siempre acarrea una certeza considerablemente
mayor, pues más importante que muchos datos es que estén bien elegidos: que sean
representativos de la población que se desea estudiar.
Para que una muestra se considere válida debe cumplir que su tamaño sea
proporcionado al tamaño de la población; que no haya distorsión en la elección de los
elementos de la muestra y que sea representativa. Para elegir estas muestras utilizamos el
muestreo y las técnicas de muestreo.
Al trabajar con muestras, hay que diferenciar los parámetros observados en la muestra
(parámetros estadísticos o simplemente estadísticos) de los parámetros reales
correspondientes a la población (parámetros poblacionales o simplemente parámetros).
Otra alternativa es el uso de tablas de números aleatorios que están formadas por
grupos de dígitos obtenidos al azar y ordenados por filas y columnas.
Ejemplo resuelto
Ejemplo resuelto
Ejemplo
Ejercicio
4.- En un centro escolar hay 1300 alumnos. Explicar cómo se elige una muestra
de tamaño 100:
a) Mediante muestreo aleatorio simple.
b) Mediante muestreo aleatorio sistemático.
Estratos E1 E2 E3 Total n n n n
1 2 3
Nº de indiv. en la población N1 N2 N3 N N N1 N 2 N 3
Nº de indiv. en la muestra n1 n2 n3 n
Ejemplo resuelto
6.- Los 1300 alumnos de un centro se reparten así: 426 de 1º, 359 de 2º, 267
de 3º, 133 de 4º, 115 de 5º. ¿Cómo se elegirá una muestra de 100 alumnos
mediante muestreo estratificado con afijación proporcional?
Ejercicio
7.- Una ganadería tiene 2000 vacas. Son de distintas razas: 853 de A, 512 de
B, 321 de C, 204 de D y 110 de E. Queremos extraer una muestra de 120:
a) ¿Cuántas hay que elegir de cada raza para que el muestreo sea
estratificado con afijación proporcional?
b) ¿Cómo ha de ser la elección dentro de cada estrato?
Sea una población de media y desviación típica , que sigue una distribución
normal N(, ), la distribución de las medias muestrales, X , de tamaño n, sigue también
una distribución normal (independientemente del tamaño de la muestra) y tiene:
Una media, X , igual a (la misma que la población); es decir, la media de las
medias muestrales ( x ) es igual a la poblacional:
x1 x 2 x k
X X
k
Una desviación típica, X , igual a : X , por consiguiente,
n n
disminuye al aumentar n. (Este resultado sólo es válido para poblaciones infinitas
o para poblaciones finitas en las que el muestreo se ha hecho con
reemplazamiento)
Por tanto si X N (, ) , entonces X N , .
n
Podemos considerar entonces que X N , .
n
Este teorema fue enunciado por primera vez por Laplace (1749-1827). Más tarde
Lyapunov (1857-1918) realizó una demostración rigurosa de este teorema.
Vamos a comprobar la veracidad de las aproximaciones anteriores con el siguiente
ejemplo.
8.- Consideremos la población formada por tres bolas contenidas en una urna y
numeradas del 2 al 4. Vamos a estudiar la distribución de las medias
muestrales cuando se realizan extracciones con reemplazamiento de tamaño
2. A continuación, comprobaremos la veracidad del Teorema Central del
Límite.
1.er paso. Obtenemos las muestras de tamaño 2, escogidas mediante m.a.s.:
(2, 2), (2, 3), (2, 4), (3, 2), (3, 3), (3, 4), (4, 2), (4, 3), (4,4)
o
2. paso. Calculamos la media de cada muestra:
2 2,5 3 2,5 3 3,5 3 3,5 4
er
3 paso. Ordenamos y agrupamos los resultados obtenidos formando la tabla de
frecuencias:
xi 2 2,5 3 3,5 4
fi 1 2 3 2 1 9
1 22 2 2,52 3 32 2
Desviación típica de X : X 3 0, 58
9
Por tanto, la distribución de las medias muestrales será: N(3; 0,58)
5.o paso. Para comprobar el Teorema Central del Límite calculamos la media y la
desviación típica poblacional:
(2, 3, 4)
23 4
Media: 3
3
22 32 42
Desviación típica: 32 0,82
3
En nuestro caso:
La población sigue una N (3; 0,82)
0,82
La distribución de medias muestrales sigue una N 3, N (3; 0, 58)
2
Luego queda comprobado el Teorema Central del Límite para esta población y
estas muestras de tamaño 2 obtenidas mediante m.a.s.
9.- Una población está formada por sólo cinco elementos, con valores 3, 5, 7, 9
y 11. Consideramos todas las muestras posibles de tamaño 2 con
reemplazamiento que puedan extraerse de esta población. Calcular:
a) Escribe las muestras de tamaño 2, escogidas mediante m.a.s.
b) La media de la población.
c) La desviación típica de la población.
d) La media de la distribución muestral de medias.
e) La desviación típica de la distribución de las medias muestrales, es
decir, el error típico de las medias.
f) Varianza de las medias muestrales.
10.- En el último año, el peso de los recién nacidos en una maternidad se ha
distribuido según una ley normal de media = 3100 g y desviación típica =
150 g.
a) ¿Cuál es la probabilidad de que un recién nacido pese más de 3130 g?
b) ¿Qué distribución seguirán las muestras de tamaño 100 de recién
nacidos?
c) ¿Cuál será la probabilidad de que la media de una muestra de 100 recién
nacidos sea superior a 3130 g?
11.- En una población (3, 7, 9, k). ¿Cuánto debe valer k sabiendo que la media de
las medias muestrales de tamaño 3, obtenidas mediante m.a.s., es 8,5?
Ejercicios
Consideremos todas las muestras de tamaño n que pueden extraerse de esa población,
en cada una de estas muestras habrá una proporción , p̂ , de individuos con una característica
dada. Todas las proporciones muestrales dan lugar a una variable aleatoria que se representa
por P̂ . La distribución de los valores de P̂ se llama distribución de las proporciones
muestrales, y tiene las siguientes características:
pˆ 1 pˆ 2 pˆ k
Pˆ p P̂ p
k
pq
Una desviación típica igual a: P̂
n
pq
Pˆ N p,
n
En la práctica:
- Si n p 3 y n q 3 la aproximación es buena.
- Si n p 5 y n q 5 la aproximación es exacta.
14.- Una población está formada por los elementos (5, 6, 9). Estudiar la
distribución de las proporciones muestrales de múltiplos de 3 cuando se
realizan extracciones con reemplazamiento de tamaño 2.
1.er paso. Obtenemos las muestras de tamaño 2, escogidas mediante m.a.s.:
(5, 5), (5, 6), (5, 9), (6, 5), (6, 6), (6, 9), (9,5), (9, 6), (9, 9)
02 0,52 0,52 12
Desviación típica de P̂ : Pˆ 0, 67 2 0, 33
9
Por tanto, la distribución de las proporciones muestrales será: N(0,67; 0,33)
4.o paso. Vamos a comprobar que se verifican las siguientes relaciones cuando la
población es finita o las muestras se extraen con reemplazamiento en una
población finita con proporciones p y q:
Media: Pˆ p
pq
Desviación típica: Pˆ
n
La proporción de múltiplos de 3 en la población es: p = 2/3 = 0,67= Pˆ
pq 0, 67 0,33
Además se verifica que: 0,33 Pˆ
n 2
Ejercicios
1.- Estimación
En la Teoría de Muestras (tema anterior), comenzamos a ver como se distribuían las
medias de las muestras a partir de la media y la desviación típica de la población; es decir,
obteníamos información de la muestra a partir de la población. En la realidad no es fácil
conocer la media y la desviación típica de la población y sí en cambio la de las muestras.
Desde el punto de vista práctico es mucho más interesante inferir información sobre
una población a partir de las muestras extraídas de ella, este es el problema que plantea la
Estadística Inferencial y que trata de resolver de dos formas:
Buscando estadísticos muestrales que puedan considerarse buenos estimadores de
los parámetros poblacionales que es lo que hace la Estadística Inductiva, bien:
Para la media muestral: N ,
n
pq
Y para la proporción muestral: N p,
n
(Se considerarán las muestras de tamaño n 30 para poder aplicar el Teorema Central
del Límite y asegurar la distribución anterior)
¿En qué consiste, por tanto, el problema de la estimación de parámetros?
a) Estimación puntual
Consiste en tomar como valor del parámetro poblacional desconocido (, p,…), el de
un estadístico ( x , p̂ ,…), obtenido de una muestra aleatoria elegida de la población objeto de
estudio, es decir, al valor ofrecido por el estimador sobre una muestra. Ahora bien, para que el
estimador funcione de forma correcta y proporcione estimaciones precisas del valor del
parámetro, deberá cumplir ciertos requisitos; estas propiedades de los estimadores son:
Eficiente: de entre varios estimadores, el más eficiente será el que tenga menor
varianza.
Tanto la media muestral como la proporción muestral tendrán mayor eficiencia al
aumentar el tamaño de las muestras.
Por ejemplo, cuando decimos que la altura media de los adolescentes es de 1,75 m
estamos haciendo una estimación puntual; en cambio, si decimos que la altura media de los
adolescentes está entre 1,73 y 1,77 m estamos haciendo una estimación por intervalos.
Dando un intervalo dentro del cual confiamos que esté el parámetro con una
probabilidad prefijada. Se llama intervalo de confianza.
En el tamaño del intervalo (cuanto más pequeño, más precisos estamos siendo).
Para estimar se recurre a una muestra de tamaño n de la cual se obtiene una media
muestral, x .
Puede ocurrir:
I .C . x z 2 , xz 2
n n
s s
I .C . x z 2 , x z 2
n n
Ejemplos
Ejercicios
4.- Sabemos que una variable estadística se comporta como una N(, 10). Para
estimar extraemos una muestra de tamaño 100, cuya media resulta ser igual
a 37. Estima mediante un intervalo de confianza del 90%.
5.- Una muestra aleatoria de 9 tarrinas de helado proporciona los siguientes
pesos en gramos: 88, 90, 90, 86, 87, 88, 91, 92, 89.
Halla un intervalo de confianza al 95% para la media poblacional sabiendo
que el peso de las tarrinas tiene una distribución normal con una desviación
típica de 1,8 g.
6.- La vida media de una muestra tomada al azar de 121 bombillas es de 3000
horas, y la desviación típica, de 220 horas. Calcula el intervalo de confianza
aproximado para la media poblacional para un nivel de confianza del 99%.
Cuanto mayor sea el nivel de confianza, 1 (es decir, cuanto más seguros
queramos estar de nuestra estimación), mayor será z 2 , por tanto, mayor es el
error que cometemos, E.
I .C . x E , x E
A 2·E A 2 z 2
n
Tanto mayor cuanto mayor sea z 2 , o sea, cuanto menor sea y mayor sea
1 . Es decir, para aumentar el nivel de confianza debemos aumentar el
tamaño de la muestra.
Tanto mayor cuanto menor sea E. Es decir, para ser más precisos en la
estimación hemos de aumentar el tamaño de la muestra.
Ejemplos
7.- Un psicólogo quiere medir el tiempo de reacción de sus pacientes y para ello
toma una muestra de 175 pacientes y realiza la estimación con un nivel de
confianza del 99%. Sabiendo que la desviación típica es de 0,05 segundos.
¿Qué error máximo ha cometido?
8.- La desviación típica de los resultados de las distintas mediciones que se
realizan para calcular la duración un proceso es = 0,5 s. ¿Cuál es el número
de medidas que hay que realizar para que, con un 99% de confianza, el error
de la estimación no exceda de 0,1 s?
9.- La duración de bombillas de una determinada marca sigue una distribución
normal de media desconocida y desviación típica 50 horas. Para estimar la
duración media se toma una muestra de 385 bombillas. ¿Con qué nivel de
confianza realizaremos la estimación si el error cometido es inferior a 5
horas?
Ejercicios
11.- Sabemos que la desviación típica de los pesos de los pollos adultos es 300 g.
Queremos estimar el peso medio de los pollos adultos de una granja con un
error menor que 100 g, y para ello, tomamos una muestra de 50 individuos.
¿Con qué nivel de confianza podremos realizar la estimación?
12.- Las calificaciones obtenidas por los estudiantes de Matemáticas siguen una
ley Normal de media desconocida y desviación típica 1,03. Para una muestra
de esa población se obtiene que (7,301; 7,385) es un intervalo de confianza,
al 94%, para la media poblacional.
a) Determina la media muestral.
b) Determina el tamaño de la muestra.
pˆ qˆ pˆ qˆ
I .C . pˆ z 2 , pˆ z 2
n n
x
pˆ , siendo x el número de éxitos que se presentan en las n pruebas.
n
Ejemplos
13.- Se hizo una encuesta a 325 personas mayores de 16 años y se encontró que
120 iban al teatro regularmente. Halla, con un nivel de confianza del 94%, un
intervalo para estudiar la proporción de los ciudadanos que van al teatro
regularmente.
14.- Tomada una muestra de 300 personas mayores de 15 años en una gran
ciudad, se encontró que 104 de ellas leían el periódico regularmente. Hallar,
con un nivel de confianza del 90%, un intervalo para estimar la proporción
de lectores de periódicos entre los mayores de 15 años.
Ejercicios
I .C . pˆ E , pˆ E
pˆ qˆ
A 2 E A 2 z 2
n
17.- A la vista del resultado del problema 14, se pretende repetir la experiencia
para conseguir un error máximo de 0,01 con el mismo nivel de confianza del
90%. ¿Cuántos individuos debe tener la muestra?
18.- A partir de una muestra de 100 individuos se ha estimado una proporción
mediante el intervalo de confianza (0,17; 0,25). ¿Cuál es el nivel de
confianza con el que se ha hecho la estimación?
19.- Se desea estimar la proporción de individuos daltónicos de una población a
través del porcentaje observado en una muestra aleatoria de individuos, de
tamaño n.
a) Si el porcentaje de individuos daltónicos en la muestra es igual al 30%,
calcula el valor de n para que, con un nivel de confianza de 0,95, el error
cometido en la estimación sea inferior al 3,1%.
b) Si el tamaño de la muestra es de 64 individuos, y el porcentaje de
individuos daltónicos en la muestra es del 35%, determina, usando un
nivel de significación del 1%, el correspondiente intervalo de confianza
para la proporción de daltónicos de la población.
Ejercicios
20.- Una encuesta realizada en cierto país sobre una muestra de 800 personas
arroja el dato de 300 son analfabetas. Para estimar la proporción de
analfabetos del país, hemos obtenido el intervalo de confianza (0,3414;
0,4086). ¿Con qué nivel de confianza se ha hecho la estimación?
21.- ¿Cuántas veces hemos de lanzar un dado, que suponemos levemente
incorrecto, para estimar la probabilidad de “6” con un error menor que
0,002 y un nivel de confianza del 95%?
k 0,00 0,01 0,02 0,03 0,04 0,05 0,06 0,07 0,08 0,09
0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199 0,5239 0,5279 0,5319 0,5359
0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596 0,5636 0,5675 0,5714 0,5753
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987 0,6026 0,6064 0,6103 0,6141
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368 0,6406 0,6443 0,6480 0,6517
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736 0,6772 0,6808 0,6844 0,6879
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088 0,7123 0,7157 0,7190 0,7224
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422 0,7454 0,7486 0,7517 0,7549
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734 0,7764 0,7794 0,7823 0,7852
0,8 0,7881 0,7910 0,7939 0,7967 0,7995 0,8023 0,8051 0,8078 0,8106 0,8133
0,9 0,8159 0,8186 0,8212 0,8238 0,8264 0,8289 0,8315 0,8340 0,8365 0,8389
1,0 0,8413 0,8438 0,8461 0,8485 0,8508 0,8531 0,8554 0,8577 0,8599 0,8621
1,1 0,8643 0,8665 0,8686 0,8708 0,8729 0,8749 0,8770 0,8790 0,8810 0,8830
1,2 0,8849 0,8869 0,8888 0,8907 0,8925 0,8944 0,8962 0,8980 0,8997 0,9015
1,3 0,9032 0,9049 0,9066 0,9082 0,9099 0,9115 0,9131 0,9147 0,9162 0,9177
1,4 0,9192 0,9207 0,9222 0,9236 0,9251 0,9265 0,9279 0,9292 0,9306 0,9319
1,5 0,9332 0,9345 0,9357 0,9370 0,9382 0,9394 0,9406 0,9418 0,9429 0,9441
1,6 0,9452 0,9463 0,9474 0,9484 0,9495 0,9505 0,9515 0,9525 0,9535 0,9545
1,7 0,9554 0,9564 0,9573 0,9582 0,9591 0,9599 0,9608 0,9616 0,9625 0,9633
1,8 0,9641 0,9649 0,9656 0,9664 0,9671 0,9678 0,9686 0,9693 0,9699 0,9706
1,9 0,9713 0,9719 0,9726 0,9732 0,9738 0,9744 0,9750 0,9756 0,9761 0,9767
2,0 0,9772 0,9778 0,9783 0,9788 0,9793 0,9798 0,9803 0,9808 0,9812 0,9817
2,1 0,9821 0,9826 0,9830 0,9834 0,9838 0,9842 0,9846 0,9850 0,9854 0,9857
2,2 0,9861 0,9864 0,9868 0,9871 0,9875 0,9878 0,9881 0,9884 0,9887 0,9890
2,3 0,9893 0,9896 0,9898 0,9901 0,9904 0,9906 0,9909 0,9911 0,9913 0,9916
2,4 0,9918 0,9920 0,9922 0,9925 0,9927 0,9929 0,9931 0,9932 0,9934 0,9936
2,5 0,9938 0,9940 0,9941 0,9943 0,9945 0,9946 0,9948 0,9949 0,9951 0,9952
2,6 0,9953 0,9955 0,9956 0,9957 0,9959 0,9960 0,9961 0,9962 0,9963 0,9964
2,7 0,9965 0,9966 0,9967 0,9968 0,9969 0,9970 0,9971 0,9972 0,9973 0,9974
2,8 0,9974 0,9975 0,9976 0,9977 0,9977 0,9978 0,9979 0,9979 0,9980 0,9981
2,9 0,9981 0,9982 0,9982 0,9983 0,9984 0,9984 0,9985 0,9985 0,9986 0,9986
3,0 0,9987 0,9987 0,9987 0,9988 0,9988 0,9989 0,9989 0,9989 0,9990 0,9990
3,1 0,9990 0,9991 0,9991 0,9991 0,9992 0,9992 0,9992 0,9992 0,9993 0,9993
3,2 0,9993 0,9993 0,9994 0,9994 0,9994 0,9994 0,9994 0,9995 0,9995 0,9995
3,3 0,9995 0,9995 0,9995 0,9996 0,9996 0,9996 0,9996 0,9996 0,9996 0,9997
3,4 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9997 0,9998
3,5 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998 0,9998
3,6 0,9998 0,9998 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,7 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,8 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999 0,9999
3,9 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000
4,0 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000 1,0000