Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Intervalos de Confianza

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 22

Inferencia Estadística: Distribuciones de

muestreo
« Macondo »

 Tenemos una pequeña ciudad


llamada “Macondo”
 En “Macondo” viven 40,000
personas
« Macondo»

La distribución de “Ingreso” en “Macondo” tiene una forma asimétrica


positiva (mayor concentración de casos en valores bajos de la variable
“Ingreso” y menor concentración en valores altos)
« Macondo»

 La INGRESO promedio de Macondo es de 2,000 pesos y la


desviación estándar es 310.12 pesos.
« Macondo »

 Macondo es una ciudad muy


frecuentada por
investigadores, que quieren
conocer cuál es el ingreso
promedio de sus habitantes. El
problema es que esa
información es un “secreto de
Estado” (aunque nosotros sí lo
sabemos…2,000 pesos).
 Hace poco un investigador hizo
una encuesta con base en un
muestreo simple al azar en
Macondo y les preguntó su Muestra 1
ingreso. Sólo tenía dinero para N = 200
200 encuestas. Luego de x = 1,988
aplicar su encuesta obtuvo los S = 410
siguientes resultados:
Error muestral

 ¿Cuánto se equivocó este investigador al tratar de estimar el ingreso promedio


de los habitantes de la ciudad, usando como información los datos de su
muestra?
 ¿Cuál fue su error muestral?

e= x−
-12 = 1,988 - 2.000
Distribución de muestreo en
Macondo

• Luego vinieron otros 500 investigadores, cada uno con


dinero para hacer su propia muestra de 200 casos
• En total, después de esa « avalancha » de
investigaciones, ahora tenemos 500 promedios
muestrales (500 estadísticos) con 500 errores
muestrales
• ¿Cómo estarían distribuidos estos estadísticos?
Distribución empírica de
muestreo

Esta es la distribución de
muestreo de la variable
“Ingreso”, es decir cómo se
distribuyen los resultados de
los 500 muestreos repetidos
que se han hecho de la misma
población para una variable.
¿Qué forma tiene esta
distribución?
¿La mayoría de las muestras,
qué resultados arrojan?

0 1 2 3 4
Ingreso
Distribución de la Variable y
Distribución de Muestreo
Distribución de promedios la
Distribución de la variable ingreso en las 500
variable Ingreso en la muestras de N=200
población

0 1 1.5 2 2.5 3 3.5 4

Como puede verse, a pesar de que la distribución de la variable “ingreso” es


asimétrica positiva, la distribución de muestreo de los 500 promedios de esta variable
resulta tener una forma más “normal”
Propiedades de una
distribución de muestreo
• Una distribución de muestreo es una representación
matemática todos los resultados posibles de muestreos
repetidos de una variable y la probabilidad de cada uno.
• Cuando el tamaño muestral es mayor que 121 casos, una
distribución de muestreo de medias tiene una forma
normal.
• La media de una distribución de muestreo de medias es
igual a la media poblacional μ. En nuestro ejemplo, es
igual a 2,000.
• Estas propiedades se basan en el teorema del límite
central, que estipula que: “Sin importar la forma de una
puntuación bruta de una variable de intervalo/razón, su
distribución muestral será normal cuando el tamaño de
la muestra, n, sea mayor que 121 casos y se centrará en
la media de la población verdadera” (Ritchey 2008: 214)
El error estándar

Ingreso Ingreso Error


 Cada muestra de una Muestra promedio promedio de muestral
distribución de muestreo Muestra 1
Muestra 2
1988
2016
2000
2000
12
-16
tiene un error muestral Muestra 3 1987 2000 13

e= x−
Muestra 4 2013 2000 -13
Muestra 5 2010 2000 -10
Muestra 6 1992 2000 8
Muestra 7 1980 2000 20

• Algunas muestras tienen Muestra 8


Muestra 9
1983
2016
2000
2000
17
-16
un error más grande que Muestra 10 1993 2000 7
Muestra 11 1991 2000 9
otras (se “equivocan” Muestra 12 2016 2000 -16
más), por ejemplo la Muestra 13
Muestra 14
1999
1988
2000
2000
1
12
muestra 2 se equivoca Muestra 15 2005 2000 -5

menos que la muestra 15 Muestra 16


Muestra 17
1988
1994
2000
2000
12
6

• ¿Cuál es el “error” Muestra 18


Muestra 19
2020
2013
2000
2000
-20
-13
promedio de una Muestra 20 2004 2000 -4
… … … …
muestra de tamaño 200? … … … …
Muestra n 2011 2000 -11
Error estándar

 Si: e= x−
• Entonces:
e=
 x−
n
• Donde n = total de muestras posibles, pero…

  x−
e= =0
 n
Error estándar

 Como el promedio simple de todos los errores muestrales es igual a cero,


para tener una idea del error estándar o “típico” de una muestra, podemos
usar la desviación estándar:
 (x − )
2

x =
n
• Como generalmente desconocemos el promedio poblacional μ, los
matemáticos han determinado que, para una muestra de tamaño n, el
error estándar de la misma puede estimarse usando la siguiente fórmula:
 sx
x =
n
• Donde Sx es la desviación estándar de la media muestral y n es el tamaño
de la misma.
• Entonces, el error estándar de una muestra de tamaño n, será la
desviación estándar de la distribución de muestreo.
Propiedades de una
distribución de muestreo
o Se trata de una distribución normal (cuando el
tamaño de la muestra es mayor a 121 casos)
o Su promedio es igual a la media poblacional
o El error estándar o típico de las muestras es la
desviación estándar de la distribución de
muestreo
Recordando las propiedades de la
distribución normal estándar

Fuente: http://es.wikipedia.org/wiki/Archivo:Standard_deviation_diagram_(decimal_comma).svg

• El promedio es igual a cero


• La desviación estándar es igual a 1
• Existe una proporción fija y conocida de casos entre dos valores de la curva
normal, por ejemplo, a dos desviaciones estándar del promedio
encontramos el 95.4% de todos los casos de la curva normal
Intervalo y nivel de confianza

• Intervalo de confianza es un rango de valores posibles


de un parámetro expresado con un nivel de confianza
• Nivel de confianza es el grado de confianza calculado
que un procedimiento estadístico realizado con datos
muestrales producirá un resultado correcto para la
población muestreada.
¿Cómo se calcula un intervalo
de confianza?
• Intervienen dos factores:
• El estadístico muestral o estimado puntual
• El estimado del error compuesto por:
• El error estándar de la muestra
• El nivel de confianza deseado

Intervalo de confianza = Estimado puntual ± estimado del error

Estimado del error = Error estándar X Nivel de confianza


¿Cómo se calcula un intervalo
de confianza? (1)
• En el ejemplo de Macondo, vimos que el primer
investigador que hizo una muestra y calculó el promedio
de ingreso a partir de ella tuvo los siguientes
resultados:
Muestra 1
N = 200
x = 1,988
S = 410

• Lo primero que hay que hacer es calcular el error


estándar de la media:
 410
= 28.99
200
Cálculo del intervalo de
confianza para la media (2):
• Luego se define el nivel de confianza. Por ejemplo, queremos tener
un 95% de confianza de que el intervalo calculado contenga el
parámetro poblacional.
• Eso quiere decir que existe un 5% de posibilidades de que nuestros
resultados no sean correctos. A esta posibilidad (la posibilidad de
equivocarnos), se le llama nivel de significancia y se le designa
mediante la letra griega alpha: α
• Sabemos que una distribución de muestreo para medias de
muestras mayores de 121 casos tiene una forma normal. Usaremos
nuestros conocimientos de la distribución normal estándar para
representar el nivel de confianza de nuestro intervalo.
Cálculo del intervalo de
confianza para la media (3):
• Por lo general, los intervalos de confianza más utilizados son del 95% y del
99%. Si vamos a calcular un intervalo de confianza del 95%, en la curva
normal ello corresponde a una puntuación de Z crítica igual a 2 (Zα=2) ya
que:

el 95% de los casos de una distribución normal


están a ± 2 desviaciones estándar de la media
(*) En realidad es el 95.4% pero para simplificar lo podemos redondear…
Cálculo del intervalo de
confianza para la media (4):
• Retomando nuestro ejemplo, tendríamos que un intervalo de confianza al
95% sería:

• En otras palabras tendríamos un 95% de confianza de que el parámetro


poblacional (la edad promedio real) estará en algún punto entre 1930 y
2045
Cálculo del intervalo de
confianza para la media:
Distribución de muestreo del ingreso

La media
poblacional
μ = 2,000

Intervalo de
confianza al
95% para la
media muestral
1,988 (1,959 a
2,016)

0 1 2 3 4
Ingreso
Referencias

 Sulmont, David. Materiales de enseñanza. Pontificia


Universidad Católica del Perú.

También podría gustarte