U2. Estimacion
U2. Estimacion
U2. Estimacion
Unidad 2. Estimación
Licenciatura en matemáticas
3er semestre
Unidad 2. Estimación
Estadística I
Clave:
05142316/06142316
Índice
Presentación de la unidad ........................................................................................................... 4
Propósitos de la unidad................................................................................................................ 4
Competencia específica ............................................................................................................... 4
Estimación ....................................................................................................................................... 4
Distribuciones de muestreo y teorema central del límite .................................................... 5
Distribuciones de muestreo relacionadas con la normal ................................................ 5
El teorema del límite central .................................................................................................. 21
la aproximación de la normal a la distribución binomial............................................... 26
Actividad 1. Distribución simétrica. .............................................................................................. 29
Actividad 2. La distribución normal .............................................................................................. 29
Métodos de construcción de estimadores ............................................................................ 29
Momentos ................................................................................................................................... 30
Máxima verisimilitud ............................................................................................................... 30
Propiedades de los estimadores.............................................................................................. 30
Sesgo ........................................................................................................................................... 30
Eficiencia relativa ..................................................................................................................... 31
Consistencia .............................................................................................................................. 31
Suficiencia.................................................................................................................................. 32
Actividad 3. La distribución binomial ........................................................................................... 32
Estadística y estimadores .......................................................................................................... 32
Estimación puntual .................................................................................................................. 33
Estimación por intervalos ...................................................................................................... 33
Estimación por intervalos ............................................................. ¡Error! Marcador no definido.
Intervalo aleatorio .................................................................................................................... 34
Intervalo de confianza ............................................................................................................. 34
Actividad 4. Teorema central del límite ....................................................................................... 40
Método pivotal de intervalos de confianza........................................................................ 40
Método general de intervalos de confianza ...................................................................... 40
Intervalos con muestras grandes ........................................................................................ 41
Evidencia de Aprendizaje. Nivel de confianza ........................................................................... 41
Presentación de la unidad
Esta segunda unidad entra de lleno la rama de la estadística inferencial. Uno de los
principales objetivos que se persiguen en la estadística inferencial es la posibilidad de
hacer generalizaciones, sacar conclusiones basadas en la probabilidad acerca de una
población determinada. Todo esto permitirá la toma de decisiones con base a la
información que puede arrogar una muestra dada de esa población por estas
características es la más usada en los trabajos de investigación.
La estadística inferencial permite inferir a partir de los valores que arrojen las muestras
extraídas de una población, como se verá en el desarrollo de esta unidad, el estudio de la
estadística inferencial permitirá hacer estimaciones. Estimar no es otra cosa que hacer
una buena aproximación de los valores de las características principales de la población
de interés. Para fines de este curso se estudiaran las estimaciones, los estimadores, y los
métodos para construirlos.
Propósitos de la unidad
Utilizar los diferentes tipos de estimación, así como los métodos para generar
estimadores, con la finalidad de describir, e interpretar la información obtenida.
Competencia específica
Estimación
La segunda unidad es bastante extensa. Son muy diversos los temas que abarca. El
primer tema, dedicado a las distribuciones de muestreo y teorema central del límite, por si
solo sería una unidad completa. Así las cosas se hará por lo tanto énfasis en los aspectos
más relevantes de cada tema.
De tal forma que la estimación por tanto, es un proceso en el cual se utilizan parámetros
de una muestra para estimar los parámetros de la población. La estimación se realiza
utilizando estimadores. La media muestral sería un estimador de la media poblacional.
El teorema de límite central se abordara en el tema 2.1.1. Pero antes es necesario señalar
un tema que resulta útil, esto es las distribuciones de muestreo relacionadas con la
normal.
A lo largo de la presente unidad te podrás dar cuenta que los temas tratados en ella están
relacionados con la distribución normal. En algunos casos se parte de la hipótesis de que
la distribución en cuestión se aproxima a la normal o que bajo ciertas circunstancias se
puede considerar como una distribución normal. Así en el punto siguiente 2.1.2. Referido
al teorema del límite central, se parte del hecho de que la media muestral se distribuirá de
manera cercana a la distribución normal.
Por tanto resulta indispensable saber lo que es una distribución normal. Para entender
mejor este tipo de distribución se aborda primeramente otras distribuciones que son
mucho más sencillas y serán de gran ayuda para el entendimiento.
Distribución uniforme.-
En estadística para muchos problemas, resulta muy útil graficar el dato contra su
probabilidad. Cuando las probabilidades de los datos son las mismas se obtiene una
distribución uniforme, un claro ejemplo de esto es el lanzamiento de un dado de seis
caras (normal, no truqueado), cuyo espacio muestral es: Ω = {1, 2, 3, 4, 5,6} y la
probabilidad para cada uno de los eventos, es idéntica = 1/6. La grafica para este ejemplo
es:
En este ejemplo todas las caras del dado tienen la misma probabilidad de salir al ser
lanzado. Por lo que la gráfica es uniforme.
Distribución simétrica.-
Ejemplo 1.
Es importante recordar que al lanzar dos dados, decimos que el número que cae es la
suma de los números que aparecen en las caras de ambos dados. Este número es
nuestra variable aleatoria “X”. Por ejemplo, si en uno de los dados hay un 1 y en el otro
un 3, decimos que cayó un cuatro. Cuando se lanzan dos dados no todos los números
tienen la misma probabilidad de caer.
Nos vamos a encontrar entonces con que: para que la suma de ambos sea dos, solo
existe una posibilidad y esta es que los dados caigan uno. Ya que si alguno de los dos
cae con un valor superior a 1, sería imposible lograr que la suma de ambos fuese igual a
Estos resultados los vamos a reportar en una tabla que llamaremos distribución de
probabilidad.
En este ejemplo el valor central es el “7”, a partir de él se forman dos mitades idénticas,
por tanto la figura es simétrica.
Distribución normal.-
Entre más grande sea el tamaño de las muestras, el grafico cada vez más y más se va
asemejar a una curva simétrica como la siguiente:
La curva es simétrica. Es decir que tiene un punto medio que la divide en dos partes
iguales.
El área bajo la curva acotada en dos puntos, representa la probabilidad de que un evento
cualquiera tenga un valor entre esos dos puntos.
El área total bajo la curva es igual a la unidad. Recuérdese la definición de integral (como
el área bajo la curva) en general en cualquier distribución de probabilidad al calcular el
área bajo la curva el valor obtenido será uno.
Por tanto cada mitad de la curva tendrá un valor igual a 0.5. En otras palabras, el área
bajo la curva de cada mitad igual a 0.5.
El área bajo la curva se puede subdividir utilizando la media como referente y cualquier
otro punto, generalmente se utilizan las desviaciones estándar. Así se dice que un punto
esta en función del numero de desviaciones estándar que diste de la media.
Ecuación de la normal
Estas tablas están referidas a una curva normal estandarizada 𝑁 (µ, 𝜎). Una distribución
normal estándar, cero, uno, se indica mediante la siguiente notación: N (0,1). En donde el
cero corresponde al valor de la media µ = 0 y el uno al valor de la desviación típica σ = 1.
Los valores: 1, 2,3 hacen referencia a las desviaciones estándar, es decir se esta a una
desviación estándar de la media, a dos a tres etc. en la tabla se van a reportar valores de
𝑧, que corresponden a los valores antes mencionados, así que se tendrán valores de 𝑧 =
1,2,3 (y todos los valores intermedios). El valor reportado en la tabla representa el área
bajo la curva y esta es la probabilidad de que ocurra el evento. De tal forma que si se
busca el valor para 𝑧 = 1, se tiene que es 0.3413, esta es el área bajo la curva que va
desde la media hasta 𝑧 = 1 y también indica que la probabilidad de que ocurra un evento
entre la media y 𝑧 = 1 es del 34.13% (0.3413).
Como la curva es simétrica los valores serán los mismos si se trata de áreas bajo la curva
que van de la media hasta 𝑧 = −1.
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Ejemplo 2.
Supóngase que se desea conocer el área bajo la curva acotada entre los valores de 𝑧 =
1y𝑧 =2
Solución:
Se recurre a la tabla “𝑧”. Se busca el valor del área bajo al curva descendiendo por la
columna de “𝑧”. Como ya se vio anteriormente, el valor reportado para 𝑧 = 1 en la tabla
es de 0.3413 (34.13%). y para 𝑧 = 2 se tiene un valor de 0.4772. estos valores
representan que:
Ejemplo 3.
Supóngase que se desea conocer el área bajo la curva acotada entre los valores de 𝑧 =
−1 y 𝑧 = 2 como se ilustra en al siguiente figura.
Solución:
Por ser simétrica la curva el área de la media hasta 𝑧 = 1 tiene el mismo valor que de la
media a 𝑧 = −1. Como los valores ya se habían obtenido en le ejemplo anterior se tiene:
En este caso el área buscada se encuentra al sumar las dos áreas encontradas.
De tal forma que se tiene:
Resultado:
Puntuaciones tipificadas
xi − µ
z =
σ
A estos valores se les llamara valores normalizados y a la curva obtenida, curva normal
estandarizada.
Ejemplo 4
𝑁 (µ, 𝜎) y el área bajo la curva es 𝑃(𝑥) 𝑁 (0,1) y el área bajo la curva es 𝑃(𝑧)
Una puntuación tipificada se puede definir como la expresión de una puntuación origen a
la nueva puntuación z. las puntuación tipificada consiste en indicar la cantidad de
Ejemplo 5:
Se desea realizar un estudio estadístico sobre el ingreso mensual (en miles de pesos) en
una población juvenil. Si se toma una muestra de tamaño n=1000 personas. Esta se
distribuye normalmente. La µ = 2 𝑦 𝑙𝑎 𝜎 = 0.5.
Se desea saber cuál es la probabilidad de que una persona tenga un ingreso mensual
superior a 3 (tres mil pesos)
Solución:
xi − µ
z =
σ
xi son los valores : 0.5, 1.0, 1.5, 2.0, 2.5, 3.0, 3.5
Sustituyendo los valores en la fórmula:
0.5 − 2 −1.5
z = = = −3.0
0.5 0.5
1.0 − 2 −1.0
z = = = −2.0
0.5 0.5
1.5 − 2 −0.5
z = = = −1.0
0.5 0.5
2−2 0
z = = = 0.0
0.5 0.5
2.5 − 2 0.5
z = = = 1.0
0.5 0.5
3.0 − 2 1.0
z = = = 2.0
0.5 0.5
3.5 − 2 1.5
z = = = 3.0
0.5 0.5
Como el área total bajo la curva es uno. Y el área total bajo la mitad de ella es 0.5 y como
se desea el área posterior a 𝑧 = 2
Se realiza la resta:
Resultado:
2.28%
Distribución binomial.-
Existen muchas situaciones donde es propia una distribución binomial. El mas claro
ejemplo es el experimento de lanzar una moneda al aire, cuyo resultado arroja águila –
sol. Tanto en la naturaleza como en la vida cotidiana se encuentran ejemplos de carácter
dual: masculino-femenino, día-noche. Entre muchos otros.
Ejemplo 6:
Se desea saber cuál será la probabilidad de que ambas monedas caigan “sol”.
Para este ejemplo se define la variable aleatoria discreta:
En otro experimento el interés podría ser cuantas águilas caen. Por lo tanto el éxito seria
el número de águilas y no el número de soles como en esta ocasión.
Generalmente la probabilidad de éxito se simboliza con la letra “𝑝” y la del fracaso con
“𝑞”. Como la probabilidad máxima es 1 y siendo complementos entonces se tiene que
𝑞 =1−𝑝
𝑛!
P(x) = (𝑛𝑥)𝑝 𝑥 𝑞𝑛−𝑥 o P(x) = 𝑥!(𝑛−𝑥)! 𝑝 𝑥 𝑞 𝑛−𝑥
Dónde:
P(x)= probabilidad de que sucedan “x” éxitos en “n” intentos.
𝑛!
(𝑛𝑥) = 𝑥!(𝑛−𝑥)!
𝑥= 𝑛ú𝑚𝑒𝑟𝑜 𝑑𝑒 é𝑥𝑖𝑡𝑜𝑠
𝑛= 𝑛𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑟𝑒𝑝𝑒𝑡𝑖𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑙 𝑒𝑥𝑝𝑒𝑟𝑖𝑚𝑒𝑛𝑡𝑜
𝑝= 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑒𝑥𝑖𝑡𝑜
𝑞= 1 − 𝑝 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 𝑓𝑟𝑎𝑐𝑎𝑠𝑜
Ejemplo 7:
Solución:
Con la información del problema se tienen los valores de las siguientes variables:
4
𝑝= = 0.4
10
6
𝑞= = 0.6
10
𝑥=2
𝑛=5
𝑛−𝑥 = 5−2 =3
Sustituyendo en la fórmula:
5!
P(2) = (0.4)2 (0.6)5−2
2!(5−2)!
Resolviendo por partes:
5! = 120
2! = 2
3! = 6
(0.4)2 = 0.16
(0.6)3 = 0.216
Sustituyendo se tiene:
120
𝑃(2) = (0.16)(0.216)
2∗6
𝑃 (2)= 0.3456
𝑃 (2)= 0.346
Dónde:
Media= µ = 𝑛 ∗ 𝑝
Varianza= 𝜎2 = 𝑛 ∗ 𝑝 ∗ 𝑞
Desviación estándar= 𝜎 = √𝑛 ∗ 𝑝 ∗ 𝑞
Estas relaciones serán de mucha utilidad cuando se vea el subtema 2.1.3. Referido a la
aproximación de la normal a la binomial.
Este teorema es algo parecido a lo visto en la ley de los grandes números, solo que en los
grandes números se hablaba de realizar muchas veces el experimento aleatorio y aquí se
trata tomar muchas muestras entre más muestras se tomen mucho más cercana será la
forma a la de una distribución normal.
La distribución de las medias seguirá una distribución Normal con la misma media que la
distribución original cuando se tomen muestras lo suficientemente grandes.
Ahora bien, Si 𝑋̅ es la media de una muestra aleatoria de tamaño “𝑛” tomada de una
población con media µ y varianza finita 2, entonces la forma límite de la distribución
queda
𝑋̅ − 𝜇
𝑧=
𝜎
s = 𝜎/√𝑛
𝑋̅ − 𝜇
𝑧=
𝜎/√𝑛
o
𝑋̅ − 𝜇
𝑧=
𝑠
Ejemplo 8
Solución:
Para este ejemplo vamos a utilizar el principio del teorema del límite central que
establece que la media muestral 𝑋̅ será la misma que la media de la población 𝜇.
Ejemplo 9
Solución:
y al igual que en el ejemplo anterior vamos a utilizar el principio del teorema del límite
central que establece que la media muestral 𝑋̅ será la misma que la media de la
población 𝜇.
𝑃 (𝑥 > 80)
𝑋 ̅ = 80
𝜇 = 𝜇𝑥 = 70
𝜎 10 10
𝜇𝑥 = = = =2
√𝑛 √25 5
𝑋̅ − 𝜇
𝑧=
𝜎/√𝑛
Nos queda:
80−70 10
𝑧= 2
= 2
=5
P (x>80) = P (z>5 )
Como ya se había indicado, se debe buscar en tablas, el área bajo la curva normal.
Ahora bien es necesario recordar que la curva es simétrica y que el área total bajo de
ella es = 1. Así que el área bajo cada mitad de la curva es = 0.5.
En seguida se muestra la tabla que se habrá de usar para resolver este ejemplo:
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
Como el área bajo la curva de la mitad de la derecha es = 0.5 y solo nos interesa saber
el área que es superior a 𝑧 = 2 se tiene que:
Por lo tanto lo que nos está diciendo el resultado es que la probabilidad de que la muestra
tomada promedie una calificación superior a 80 es muy baja, apenas del 2%.
Ejemplo 10
Solución
b) Multiplicamos 0.4129 por 11500 y obtenemos 4748.35 que serían los 4748
alumnos con promedio superior a 8.6 en la UNADM
Ya en el tema anterior donde se vio el teorema central del límite se estableció que
conforme va en aumento el tamaño de las muestras las distribuciones tienden hacia una
distribución normal.
Se obtienen histogramas para la distribución binomial que (al igual que para los
anteriores) tienden hacia una distribución normal, a medida que aumentan los valores de
“𝑛” (número de ensayos) y “𝑝” (𝑞𝑢𝑒 𝑒𝑠 𝑙𝑎 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑 𝑑𝑒 é𝑥𝑖𝑡𝑜) se aproxima a un valor de
½ = o.5.
Ahora bien cuando se tiene un problema con distribución binomial, si este se puede
resolver más fácilmente mediante la aproximación hacia una distribución normal. Se debe
que tomar en cuenta que como la distribución binomial es del tipo discreto y la distribución
normal es del tipo continuo, se tiene que hacer un ajuste llamado ajuste por continuidad.
Los valores de este factor de ajuste son ±0.5.
caso1: se utilizara el valor de +0.5 cuando la probabilidad buscada tenga las expresiones:
Para encontrar el valor de “𝑧” que se buscara en las tablas se tendrá que resolver la
siguiente ecuación:
x − µ ± 0.5
𝑧=
σ
Dónde:
Media= µ = 𝑛 ∗ 𝑝
Varianza= 𝜎2 = 𝑛 ∗ 𝑝 ∗ 𝑞
Desviación estándar= 𝜎 = √𝑛 ∗ 𝑝 ∗ 𝑞
Ejemplo 11
En una escuela se toma una muestra aleatoria de tamaño 𝑛 = 100 alumnos. La escuela
tiene una población mixta compuesta de hombres y mujeres. La población de mujeres es
del 5%. Se desea saber cual seria la probabilidad de encontrar 3 o mas mujeres en la
muestra tomada.
Solución:
De donde:
Sustituyendo datos:
Media= µ = 𝑛 ∗ 𝑝
Sustituyendo:
µ = 𝑛 ∗ 𝑝 = 100 ∗ 0.05 = 5
Desviación estándar= 𝜎 = √𝑛 ∗ 𝑝 ∗ 𝑞
Sustituyendo:
Estas son las que se utilizaran para encontrar los valores que se sustituyan en la
ecuación que nos permita calcular el valor de “z”.
x − µ ± 0.5
𝑧=
σ
−2.5
z= 2.18 = -1.15
Buscando en la tabla de 𝑧, el área encontrada es: 0.3749
Este valor corresponde al área que va de 3 hasta la µ=5, por lo tanto hay que sumar el
resto del área que correspondería a los valores superiores a 5.
𝑃 (𝑥 ≥ 3) = 87.49%
Existen dos tipos de estimación: la estimación puntual y la estimación por intervalos que
se verán más adelante en el tema 2.4, de esta unidad. Respecto a la estimación puntual o
por punto, existen algunos métodos que se utilizan para realizar dicha estimación: el
método de estimación por momentos y el método de estimación máximo verosímil. Que
se verán en seguida.
Momentos
Máxima verisimilitud
Estos estimadores tienen ciertas propiedades, entre las que se destacan: el sesgo, la
eficiencia, la consistencia y la suficiencia. A continuación se pasara a revisar dichas
propiedades.
Sesgo
A grosso modo se puede decir que un estimador es insesgado cuando coincide con los
parámetros poblacionales, trátese de la media o cualquier otro. Por el contrario un
estimador se considera sesgado o con sesgo, cuando no coincide con los parámetros
poblacionales, ya sea que se trate de la media, la desviación estándar o cualquier otro.
Eficiencia relativa
El termino eficiencia es de cierta manera de mucho uso cotidiano, pongamos por ejemplo
a un trabajador de una empresa. ¿Qué significa que este trabajador sea eficiente?, una
posible respuesta es que el trabajador cumpla con las tareas que se le han asignado en
los tiempos estipulados. Es decir el trabajador debe cumplir con ciertas características, de
manera análoga un estimador será eficiente si cumple con ciertas características
estadísticas.
Consistencia
Suficiencia
Estadística y estimadores
En la unidad uno de este curso de estadística se vieron los diferentes tipos de medidas:
medidas de posición, de asociación y de tendencia central. En todas ellas se trabajó con
varios parámetros estadísticos, cabe recordar algunos: la media, la desviación estándar
entre otros. Ahora bien como se señaló, estos parámetros pueden referirse a la población
o aun muestra representativa (aleatoria) de dicha población.
Cuando se utiliza el parámetro x , se está haciendo una estimación del parámetro µ. Por
tal motivo algunos autores señalan que: x estima a µ.
Los estimadores son los agentes para realizar una estimación y como ya se ha indicado,
en estadística se tienen dos tipos de estimaciones
Estimación puntual
Ya en el párrafo anterior se vio lo que es una estimación por intervalos, se vio la definición
y se trató de entender su diferencia con la estimación puntual.
Intervalo aleatorio
Como ya se vio se tienen básicamente dos tipos de estimación, estas son la puntual y la
estimación por intervalos. Un intervalo como se vio en el subtema anterior se puede
asemejar al concepto de rango (rango=valor máximo – valor mínimo). Estos valores
máximo y mínimo, en intervalos se les llaman límite superior y límite inferior. Ahora bien
se le llama intervalo aleatorio, al intervalo que se construye y al menos uno de sus límites
es una variable aleatoria.
Dónde:
Intervalo de confianza
Se han revisado los dos tipos de estimación, se vio que una estimación por intervalos
consta de dos valores, un valor máximo y un valor mínimo y que en estimación se les
conoce como límite superior y límite inferior respectivamente. Cuando se trata de un
Los intervalos de confianza están asociados a cierto nivel de confianza, por ejemplo: un
90% o expresado en forma decimal un 0.90 de confianza.
El intervalo de confianza por tanto expresa un cierto nivel de probabilidad, esto implica
que existe un riesgo de error conocido. Por otra parte el intervalo de confianza
proporcionar valores enfocados en el valor estadístico muestral, pero el parámetro
poblacional también se ubica dentro del intervalo.
Para construir los intervalos de confianza es necesario saber qué tipo de distribución
siguen los datos que se están trabajando. Si se tiene que son del tipo de una distribución
normal, entonces se procede de acuerdo al siguiente esquema, en donde se tienen varios
componentes.
Como ya se había visto en el subtema 2.1.1 la curva es simétrica y el área total bajo de
ella es igual a 1. Representa el 100% de probabilidad. Donde, 1- α es el nivel de
confianza. Esta acotado por los valores de – 𝑧 𝑦 𝑧. Las zonas antes de – 𝑧 y después de 𝑧.
son las colas de la distribución y representan el riesgo de error. Sumar las dos colas da
Por ejemplo si se tiene que 1- α es del 90% (0.9), esto implica que 𝛼 es del 10% (0.01).
Es decir se tiene el 10% de probabilidad de que los valores medios de la muestra estén a
−1.65 desviaciones estándar (el 5% de la cola izquierda) y a +1.65 (el otro 5% que
corresponde a la cola derecha) desviaciones estándar, de la media. Esto se puede
comprender mucho mejor con la siguiente imagen:
O bien
s
𝑥̅ ± 𝑧 ( )
√𝑛
Dónde:
𝜎
𝜎𝑥 = 𝜎 = 𝜎√𝑛 = error muestral
𝑥
𝜎 =Desviación estándar
𝑛= tamaño de la muestra
Generalmente se trabajan los problemas con un nivel de confianza dado, por ejemplo del:
90%, 95% y 99%. Que equivalen respectivamente a: 0.9, 0.95, 0.99.
Para buscar el valor de 𝑧, es necesario usar el nivel de confianza entre 2, dado que se
tiene una curva normal simétrica que tiene dos mitades. El nivel de confianza entre 2,
arroja un área bajo la curva, este es el dato con el que se ha de buscar el valor de 𝑧 en las
tablas. Por ejemplo si se trabaja con un nivel de confianza del 99% o su equivalente 0.99,
no es este valor el que hay que buscar en tablas. Se busca la mitad, es decir 0.99/2 =
0.495, ósea
1−α
= 0.495
2
Ejemplo 12
Se desea hacer un estudio con la población estudiantil de una escuela para lo cual se
toma una muestra aleatoria. Obteniéndose la siguiente información:
Solución:
Así:
Como se tiene que la distribución es de tipo normal, y esta es simétrica, entonces para
cada mitad se tiene:
α
2
=0.005
1 − 𝛼 = 0.99
1−α
= 0.495
2
Este es el valor que se utilizara para encontrar el valor de 𝑧.
En seguida se muestra la tabla que se habrá de usar para encontrar el valor de 𝑧 de este
ejemplo:
Es la misma tabla utilizada en el cálculo del teorema central del límite, solo que ahora se
comienza buscando el área bajo la mitad de la curva, que para este ejemplo es del 0.495.
Una vez localizado este valor se obtiene el valor de 𝑧 correspondiente. Como se puede
observar en la tabla se marca el área =0.495, siguiendo la fila se ve que corresponde a
un valor de 𝑧 = 2.5 pero como el valor de 0.495, esta en la columna que corresponde a
0.08 decimales, el valor total de z=2.58
Z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09
0.0 0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359
0.1 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753
0.2 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141
0.3 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517
0.4 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879
0.5 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224
0.6 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549
0.7 0.2580 0.2611 0.2642 0.2673 0.2704 0.2734 0.2764 0.2794 0.2823 0.2852
0.8 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133
0.9 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3365 0.3389
1.0 0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621
1.1 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
1.2 0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015
1.3 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177
1.4 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319
1.5 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441
1.6 0.4452 0.4463 0.4474 0.4484 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
1.7 0.4554 0.4564 0.4573 0.4582 0.4591 0.4599 0.4608 0.4616 0.4625 0.4633
1.8 0.4641 0.4649 0.4656 0.4664 0.4671 0.4678 0.4686 0.4693 0.4699 0.4706
1.9 0.4713 0.4719 0.4726 0.4732 0.4738 0.4744 0.4750 0.4756 0.4761 0.4767
2.0 0.4772 0.4778 0.4783 0.4788 0.4793 0.4798 0.4803 0.4808 0.4812 0.4817
2.1 0.4821 0.4826 0.4830 0.4834 0.4838 0.4842 0.4846 0.4850 0.4854 0.4857
2.2 0.4861 0.4864 0.4868 0.4871 0.4875 0.4878 0.4881 0.4884 0.4887 0.4890
2.3 0.4893 0.4896 0.4898 0.4901 0.4904 0.4906 0.4909 0.4911 0.4913 0.4916
2.4 0.4918 0.4920 0.4922 0.4925 0.4927 0.4929 0.4931 0.4932 0.4934 0.4936
2.5 0.4938 0.4940 0.4941 0.4943 0.4945 0.4946 0.4948 0.4949 0.4951 0.4952
2.6 0.4953 0.4955 0.4956 0.4957 0.4959 0.4960 0.4961 0.4962 0.4963 0.4964
2.7 0.4965 0.4966 0.4967 0.4968 0.4969 0.4970 0.4971 0.4972 0.4973 0.4974
2.8 0.4974 0.4975 0.4976 0.4977 0.4977 0.4978 0.4979 0.4979 0.4980 0.4981
2.9 0.4981 0.4982 0.4982 0.4983 0.4984 0.4984 0.4985 0.4985 0.4986 0.4986
3.0 0.4987 0.4987 0.4987 0.4988 0.4988 0.4989 0.4989 0.4989 0.4990 0.4990
10 10
IC = 55 ± 2.58 ( ) = 55 ± 2.58 ( )
√49 7
IC = 55 ± 3.68
𝐼𝐶 = (51.31, 58.68)
Del resultado obtenido se desprende por lo tanto que existe la probabilidad del 99% de
que el valor de µ este en el intervalo comprendido entre: 51.31 𝑦 58.68.
Cuando se trabaja con muestras de tamaño grande, disminuye el error de muestreo y por
lo mismo el intervalo será más preciso. También disminuirá el error típico y el intervalo
será menos ancho.
Cabe mencionar que también se pueden construir intervalos de confianza usando otras
distribuciones diferentes a la distribución normal. Pero ese tema será parte de otro curso.
A través de esta actividad utilizarás las propiedades del teorema central del límite central
para resolver problemas específicos.
Ya que se está abordando el intervalo de confianza, resulta pertinente decir que este se
puede construir mediante el uso del método del pivote (método pivotal). Este método esta
basado en la determinación de una expresión pivote. Esta expresión pivote es función de
las mediciones de la muestra y del parámetro poblacional desconocido. El parámetro
poblacional desconocido es el único valor desconocido. En tanto el pivote presenta una
distribución que no depende del parámetro poblacional.
Supóngase que se tiene un estadístico “r” que presenta una distribución normal. Se puede
construir un intervalo para “𝑟” 𝑃(𝑧1 ≤ 𝑟 ≤ 𝑧2) = 1 − 𝛼 .
Recién se vio el método del pivote, el cual consistía en localizar una cantidad pivotal. Este
Este tema de los intervalos con muestras grandes ya se ha venido utilizando en los
temas anteriores, sobre todo en la construcción de intervalos de confianza. Es importante,
sin embargo dejar en claro que en la estadística inferencial se tienen básicamente dos
categorías para los tamaños de muestras, las categorías tamaño grande y tamaño
pequeño.
Cuando se tiene el primer caso es decir que el tamaño de las muestras es grande, se
trabaja con la distribución normal. (Esto ya se hizo en el subtema anterior)
Cuando se trata de muestras pequeñas se utiliza otro tipo de distribución, sobre todo la
distribución t de Student (siempre y cuando la población se distribuya normalmente).
Al trabajar con la distribución normal se observa que sobre todo para muestras pequeñas,
la aproximación de la desviación estándar “𝑠” de la muestra (o muestras) a la desviación
estándar de la población, es deficiente. Por ello la distribución “𝑡” de Student es una
distribución que tendera a una mayor dispersión en comparación con la distribución
normal.
Revisa el documento de actividades U2, donde se dan las instrucciones para resolver la
actividad.
Autorreflexiónes
Cierre de la unidad
Te invito a revisar los siguientes links, para poder ampliar tus conocimientos revisados en
la unidad 2.
http://www.fca.unl.edu.ar/InferEst/EstimParam.htm
Fuentes de consulta