Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Distribuciones Muestralesp1

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

Capı́tulo 1

Introducción

Introducción: El campo de la inferencia estadı́stica está formado por los métodos


utilizados para tomar decisiones o para obtener conclusiones sobre una población. Estos
métodos utilizan la información contenida en una muestra de la población para obtener
conclusiones. La siguiente figura indica la relación que existe entre una población y una
muestra.

La inferencia estadı́stica puede dividirse en dos grandes áreas: Estimación de

5
6 1. Introducción

parámetros y prueba de hipótesis. Por ejemplo, un problema de estimación es el siguien-


te: supongamos que un ingeniero analiza la resistencia a la tensión de un componente
empleado en la carrocerı́a de un automóvil. Como la variabilidad existe de manera na-
tural en la resistencia a la tensión entre distintos componentes, debido a las diferencias
en los lotes de materia prima, en el proceso de fabricación y en los procedimientos de
medición, el ingeniero está interesado en estimar la resistencia a la tensión promedio
de los componentes. El conocimiento de las propiedades de muestreo estadı́sticas del
estimador utilizado, permite al ingeniero establecer la precisión del valor estimado.
Consideremos ahora una situación en la que se estudian dos tiempos de dedicación
a un curso, t1 y t2 . El investigador establece la conjetura de que el tiempo t1 dará
como resultado rendimientos mayores que t2 . La prueba estadı́stica de hipótesis es un
marco de referencia para resolver problemas de este tipo. En este caso, la hipótesis es
que el rendimiento promedio con el tiempo de estudio t1 es mayor que el rendimiento
promedio con el tiempo de estudio t2 . Notemos que no se hace hincapié en la estimación
de los rendimientos; en su lugar, la atención se centra en obtener conclusiones sobre la
hipótesis planteada.

Definición 1.1 (Población) Es un conjunto formado por la totalidad de las obser-


vaciones en las cuales se tiene cierto interés.

En cualquier problema particular, la población puede ser pequeña, grande pero


finita o infinita. El número de observaciones en la población recibe el nombre de tamaño
de la población. Por ejemplo, el ingreso de los habitantes de una ciudad, y el número de
botellas con un contenido menor de bebida en un dı́a de producción de una compañı́a de
gaseosas, son poblaciones de tamaño finito. Las observaciones obtenidas al medir todos
los dı́as el nivel de monóxido de carbono, es una población de tamaño infinito. Por
otra parte, un ingeniero puede considerar que la población de resistencias a la tensión
tiene una distribución normal con media µ y varianza σ 2 . Puede hacerse referencia a
este hecho diciendo que es una población normal o que es una población normalmente
distribuida.
En muchos problemas de inferencia estadı́stica, es imposible o poco práctico ob-
servar toda la población. Por ejemplo, no es posible medir el contenido de todas las
botellas producidas, ya que esto lleva mucho tiempo y tiene un costo alto. Por otra
parte, algunas (quizás muchas) de las botellas todavı́a no están llenas en el momento
en que tiene que tomarse una decisión, ası́ que, en gran medida, la población debe
verse como algo conceptual. En consecuencia, se depende de un subconjunto de las
observaciones provenientes de la población que sean de ayuda para tomar decisiones
sobre esta.

Definición 1.2 (Muestra) Es un subconjunto de observaciones seleccionadas de una


población.
7

Para que las inferencias sean válidas, la muestra debe ser representativa de la pobla-
ción. A menudo puede resultar atractivo seleccionar las observaciones más convenientes
como muestra o ejercitar el juicio en la selección de la muestra. Es frecuente que estos
procedimientos introduzcan un sesgo en la muestra, lo que trae como consecuencia que
el parámetro de interés sea subestimado (o sobrestimado) por la muestra. Por otra par-
te, no es posible describir de manera estadı́stica el comportamiento de una muestra de
este tipo. Para evitar estas dificultades, es deseable seleccionar una muestra aleatoria
como el resultado de un mecanismo aleatorio. En consecuencia, la selección de una
muestra es un experimento aleatorio, y cada observación de la muestra es el valor
observado de una variable aleatoria. Las observaciones en la población determinan la
distribución de probabilidad de la variable aleatoria.
Para definir una muestra aleatoria, sea X la variable aleatoria que representa el
resultado de tomar una observación de la población. Sea f (x) la función de probabi-
lidad de X. Supongamos que cada observación en la muestra se obtiene de manera
independiente, bajo las mismas condiciones. Es decir, las observaciones de la muestra
se obtienen al observar X de manera independiente bajo condiciones que no cambian,
por ejemplo n veces. Sea Xi la variable aleatoria que representa la i-ésima réplica. En-
tonces X1 , X2 , . . . , Xn constituyen una muestra aleatoria donde los valores numéricos
son x1 , x2 , . . . , xn . Las variables aleatorias en una muestra aleatoria son independien-
tes, con la misma distribución de probabilidad f (x) debido a que cada observación se
obtiene bajo las mismas condiciones. Es decir, las funciones de probabilidad marginal
de X1 , X2 , . . . , Xn son f (x1 ), f (x2 ), . . . , f (xn ), respectivamente, y por independencia,
la función de probabilidad conjunta de la muestra aleatoria es

fX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn ) = f (x1 )f (x2 ) . . . f (xn ).

Definición 1.3 (Muestra Aleatoria) Las variables aleatorias (X1 , X2 , . . . , Xn )


constituyen una muestra aleatoria de tamaño n, si

a) Las Xi son variables aleatorias independientes.

b) todas las Xi tienen la misma distribución de probabilidad.

Ejemplo 1 Supongamos que se investiga la duración efectiva de un componente


electrónico utilizado en un marcapaso cardı́aco, y que la duración del componente tiene
una distribución normal. Entonces se espera que cada una de las observaciones de la
duración del componente X1 , X2 , . . . , Xn en una muestra aleatoria de n componentes,
sean variables aleatorias independientes con la misma distribución normal. Después
de recopilar los datos, los valores numéricos de los tiempos de duración observados se
denotan por x1 , x2 , . . . , xn .

El propósito principal de la toma de una muestra aleatoria es obtener información


sobre los parámetros no conocidos de la población. Supongamos, por ejemplo, que
8 1. Introducción

se desea alcanzar una conclusión acerca de la población de habitantes del paı́s que
prefieren una marca particular de gaseosa. Sea p el valor no conocido de esta proporción.
Resulta poco práctico interrogar a cada persona de la población para determinar el
verdadero valor de p. Para hacer una inferencia con respecto a la proporción verdadera
p, un procedimiento más razonable consiste en seleccionar una muestra aleatoria (de
un tamaño apropiado) y utilizar la proporción observada p̂ de personas en la muestra
que prefieren cierta marca de gaseosa.
La proporción de la muestra, p̂, se calcula dividiendo el número de personas de
la muestra que prefieren una marca particular de gaseosa entre el tamaño total de la
muestra, n. Por lo tanto, p̂ es una función de los valores observados en la muestra
aleatoria. Puesto que es posible obtener muchas muestras aleatorias de una población,
el valor de p̂ cambiará de una a otra. Es decir, p̂ es una variable aleatoria. Esta variable
aleatoria se conoce como estadı́stica, estadı́grafo o estimador.

Definición 1.4 (Estadı́stica) Una estadı́stica es cualquier función de las observa-


ciones contenidas en una muestra aleatoria.

Ejemplo 2 Promedio (x), varianza (S 2 ), desviación estándar (S).

1.1. Distribuciones muestrales


La inferencia estadı́stica tiene que ver con la toma de decisiones sobre una población,
con base en la información contenida en una muestra aleatoria de esta. Por ejemplo,
supongamos que se tiene interés en el volumen promedio de lı́quido de un envase de
gaseosa. Se requiere que el volumen promedio de la población sea 300 ml. Un estadı́stico
toma una muestra aleatoria de 25 envases y calcula el volumen promedio en la muestra,
el cual resulta ser x = 298 ml. Es probable que el estadı́stico decida que la media de
la población es µ = 300 ml, a pesar de que la media de la muestra es 298 ml, ya que
sabe que la media muestral es un estimador razonable de µ y que es muy probable
obtener una media muestral de 298 ml, incluso si la media verdadera de la población
es µ = 300 ml. De hecho, si la media verdadera es 300 ml, entonces la prueba puede
repetirse con 25 envases, digamos cada 5 minutos, lo que producirá valores de x que
estarán por encima y por debajo de µ = 300 ml.
La media muestral es un estimador; es decir, una variable aleatoria que depende
de los resultados obtenidos en cada muestra particular. Dado que un estimador es una
variable aleatoria, entonces tiene una distribución de probabilidad.

Definición 1.5 La distribución de probabilidad de un estimador recibe el nombre de


distribución de muestreo.

Por ejemplo, la distribución de probabilidad de x se conoce como distribución de mues-


treo de la media.
1.1. Distribuciones muestrales 9

1.1.1. Distribución muestral de la media


Consideremos la determinación de la distribución de muestreo de la media muestral
X. Supongamos que se toma una muestra aleatoria de tamaño n de una población
normal con media µ y varianza σ 2 . Cada observación en esta muestra (por ejemplo
X1 , X2 , . . . , Xn ) es una variable aleatoria distribuida normal e independientemente,
con media µ y varianza σ 2 . Entonces, por la propiedad reproductiva de la distribución
normal, concluimos que la media muestral
X1 + X 2 + . . . + Xn
X=
n
tiene una distribución normal con media
µ + µ + ... + µ
µX = =µ
n
y varianza
2 σ2 + σ2 + . . . + σ2 σ2
σX = = .
n2 n
Si se muestrea una población que tiene una distribución de probabilidad desconocida,
la distribución de muestreo de la media muestral seguirá siendo aproximadamente
normal con media µ y varianza σ 2 /n, si el tamaño de la muestra n es grande.

NOTA: Propiedad reproductiva de la distribución normal.


Si X1 , X2 , . . . , Xp son v.a. normales independientes con E[Xi ] = µi y V [Xi ] =
2
σi , i = 1, p, entonces
Y = C 1 X1 + C 2 X 2 + . . . + C p Xp
es una v.a. normal con

E[Y ] = C1 µ1 + C2 µ2 + . . . + Cp µp

y
V [Y ] = C12 σ12 + C22 σ22 + . . . + Cp2 σp2 .

1.1.2. Teorema central del lı́mite


Teorema 1.1 Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamaño n tomada de una
población (finita o infinita) con media µ y varianza finita σ 2 ; si n es lo bastante grande,
la distribución de muestreo de la media de la muestra X se puede aproximar con una
función de densidad normal.

La aproximación normal para X depende del tamaño n de la muestra. En la figura


1.1, la figura (a) presenta la distribución obtenida por los lanzamientos de un dado
equilibrado. Las probabilidades son iguales (1/6) para todos los valores obtenidos, 1, 2,
3, 4, 5 ó 6. La figura (b) presenta la distribución del puntaje promedio obtenido cuando
10 1. Introducción

se lanzan dos dados, y las figuras (c), (d) y (e) contienen la distribuciones de los pun-
tajes promedio obtenidos cuando se lanzan tres, cinco y diez dados, respectivamente.
Notemos que, si bien la población (un dado) está relativamente lejos de ser normal,
la distribución de los promedios queda aproximada, de manera razonablemente buena,
por la distribución normal, incluso para tamaños de muestra tan pequeños como cinco.
Aunque, en muchos casos, el teorema central del lı́mite funciona bien para muestras
pequeñas (n=4 ó 5), en particular donde la población es continua, unimodal y simétrica,
en otras situaciones se requiere muestras grandes, dependiendo de la forma que tenga
la población. En muchos casos de interés práctico, si n ≥ 30, la aproximación normal
será satisfactoria sin importar cuál sea la forma de la población. Si n < 30, el teorema
central del lı́mite funciona si la distribución de la población no está muy alejada de
una distribución normal.

Figura 1.1: Distribución de X según el número de dados lanzados.

Ejemplo 3 Una compañı́a de electrónica fabrica resistores que tienen una resistencia
promedio de 100 Ω (ohmios) y una desviación estándar de 10 Ω. La distribución de
1.1. Distribuciones muestrales 11

la resistencia es normal. Encuéntrese la probabilidad de que al tomar una muestra de


n = 25 resistores, la resistencia promedio de éstos sea menor que 95 Ω.
Solución:

Ejemplo 4 Supongamos que una variable aleatoria X tiene la distribución uniforme


continua (
1/2 , 4 ≤ x ≤ 6
f (x) =
0 , en cualquier otro caso.
Encontrar la distribución de la media muestral de una muestra aleatoria de tamaño
n = 40.

Definición 1.6 (Error estándar) El error estándar de un estimador es la desvia-


ción estándar de su distribución de muestreo. Si el error estándar involucra parámetros
desconocidos cuyos valores pueden estimarse, la sustitución de estas estimaciones en
el error estándar da como resultado un error estándar estimado.

2
Ejemplo 5 Si X → N (µ, σ 2 ) ⇒ X → N (µ, σn ) y √σn es el error estándar.
s
Si σ 2 es desconocido, entonces σ
bX = √ es el error estándar estimado.
n

1.1.3. Distribución muestral de una proporción


Consideremos una población en la que la proporción de elementos poblacionales
portadores de una cierta caracterı́stica es p. Es decir, la población puede ser considerada
como una variable aleatoria X de modo que

1, si el elemento es portador de la caracterı́stica
X=
0, si el elemento no es portador de la caracterı́stica
12 1. Introducción

Luego la media y la varianza de la población será:


µ = E[X] = p y σ 2 = V [X] = pq
en que consideramos a la distribución Bernoulli de la forma

x 0 1
p(x) q p

Definición 1.7 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población


con media E[X] = p y varianza V [X] = pq, y sea X1 + X2 + . . . + Xn la estadı́stica
que denota el número total de elementos portadores de la caracterı́stica de interés en la
muestra. La proporción de elementos portadores de la caracterı́stica de interés es dada
por
X 1 + X2 + . . . + X n X
pb = =
n n
en que X representa el número de elementos de la muestra portadores de la carac-
terı́stica de interés y n es el número total de elementos de la muestra.

La distribución muestral del estimador pb se denomina distribución muestral de una


proporción, cuya media y varianza son:
 
X1 + X 2 + . . . + Xn 1 1
µpb = E[b p] = E = E[X1 + X2 + . . . + Xn ] = np = p
n n n
 
X1 + X2 + . . . + Xn 1 1 pq
σp2b = V [b
p] = V = 2 V [X1 + X2 + . . . + Xn ] = 2 npq =
n n n n

Teorema 1.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población de


ensayos Bernoulli con parámetro p, y sea pb la proporción muestral.

a) Si el muestreo se hace con reemplazo o si la población es infinita, entonces:

E[bp] = p
pq
V [b
p] =
n

b) Si el muestreo se hace sin reemplazo de una población finita de tamaño N enton-


ces:

E[b
p] = p
 
pq N −n
V [b
p] =
n N −1

NOTAS:

a) Una regla práctica que se sigue con frecuencia establece que la distribución mues-
tral de pb es aproximadamente normal, si np > 5 y nq > 5.
1.1. Distribuciones muestrales 13

N −n

b) El factor de corrección de población finita N −1
, se puede dejar de utilizar en
las aplicaciones prácticas cuando Nn ≤ 0,05.

c) Corrección por continuidad:

Proporción:
!
1
p0 + 2n −p
p ≤ p0 ) = P
P (b Z≤ p pq
n
!
1
p0 − 2n −p
p ≥ p0 ) = P
P (b Z≥ p pq
n

Binomial:

x + 12 − np
 
P (X ≤ x) = P Z ≤ √
npq
1
x − 2 − np
 
P (X ≥ x) = P Z ≥ √
npq

Ejemplo 6 Si de una población de adultos, el 15 % están sometidos a un tipo espe-


cial de dieta, cuál es la probabilidad de que una muestra de 100 personas muestre las
siguientes proporciones de individuos a dieta:

a) mayor o igual que 0,20.

b) entre 0,10 y 0,20.


14 1. Introducción

Ejemplo 7 Un encuestador polı́tico efectúa un análisis de los resultados de la muestra


para hacer pronósticos para la elección. Supóngase que se trata de una elección con
dos candidatos; si un candidato especı́fico recibe cuando menos 52 % de los votos en la
muestra, entonces se pronosticará que ese candidato será el ganador de la elección. Si
se selecciona una muestra aleatoria de 600 votantes, ¿cuál es la probabilidad de que se
pronostique como ganador a ese candidato cuando,

a) el porcentaje real de sus votos es 50,3 %?

b) el porcentaje real de sus votos es 60 %?

1.1.4. Distribución muestral de la diferencia entre dos medias


muestrales
Consideremos el caso donde se tienen dos poblaciones independientes. Supongamos
que la primera población tiene una media µ1 y una varianza σ12 , mientras que la segunda
población tiene una media µ2 y una varianza σ22 . Supongamos además que ambas
poblaciones están normalmente distribuidas. Entonces, la distribución de muestreo de
X 1 − X 2 es normal con media

µX 1 −X 2 = µX 1 − µX 2 = µ1 − µ2

y varianza
2 2 2 σ12 σ22
σX 1 −X 2
= σX + σX = +
1 2n1 n2
Si las dos poblaciones no están distribuidas de manera normal, pero el tamaño de am-
bas muestras n1 y n2 es mayor que 30, entonces puede emplearse el teorema central del
1.1. Distribuciones muestrales 15

lı́mite y suponer que X 1 y X 2 siguen, de manera aproximada, distribuciones normales


independientes. Por lo tanto, la distribución de muestreo de X 1 − X 2 es aproximada-
mente normal con media y varianza

2 σ12 σ22
µX 1 −X 2 = µ1 − µ2 y σX 1 −X 2
= +
n1 n2

Si n1 o n2 es menor que 30, entonces la distribución de muestreo de X 1 − X 2 seguirá


siendo aproximadamente normal, con media y varianza igual a lo mencionado anterior-
mente, siempre y cuando la población de la que se toma la muestra pequeña no se aleje
de manera importante de la población normal.

Definición 1.8 Si se tienen dos poblaciones independientes con medias µ1 y µ2 , y


varianzas σ12 y σ22 , y si X 1 y X 2 son las medias muestrales de dos muestras aleatorias
independientes de tamaños n1 y n2 de estas poblaciones, entonces la distribución de
muestreo de
X 1 − X 2 − (µ1 − µ2 )
Z= q 2
σ1 σ2
n1
+ n22
es aproximadamente normal estándar, si se aplican las condiciones del teorema central
del lı́mite. Si las dos poblaciones son normales, entonces la distribución de muestreo
de Z es, de manera exacta, normal estándar.

Ejemplo 8 La vida eficaz de un componente utilizado en la turbina de una aeronave


es una variable aleatoria con media 5000 horas y desviación estándar de 40 horas. La
distribución de la vida eficaz es muy próxima a una distribución normal. El fabricante
de la turbina introduce una mejora en el proceso de fabricación de este componente,
que aumenta el tiempo de vida útil promedio a 5050 horas y disminuye la desviación
estándar a 30 horas. Supongamos que se toma del proceso “antiguo” una muestra alea-
toria de n1 = 16 componentes, y una muestra aleatoria del proceso “mejorado” de
n2 = 25 componentes. ¿Cuál es la probabilidad de que la diferencia entre las dos me-
dias muestrales X 2 − X 1 sea al menos 25 horas? Supóngase que los procesos antiguo y
mejorado pueden considerarse como poblaciones independientes.

También podría gustarte