Distribuciones Muestralesp1

Capı́tulo 1
Introducción
Introducción: El campo de la inferencia estadı́stica está formado por los métodos

utilizados para tomar decisiones o para obtener conclusiones sobre una población. Estos
métodos utilizan la información contenida en una muestra de la población para obtener
conclusiones. La siguiente figura indica la relación que existe entre una población y una
muestra.
La inferencia estadı́stica puede dividirse en dos grandes áreas: Estimación de
5
6 1. Introducción
parámetros y prueba de hipótesis. Por ejemplo, un problema de estimación es el siguien-

te: supongamos que un ingeniero analiza la resistencia a la tensión de un componente
empleado en la carrocerı́a de un automóvil. Como la variabilidad existe de manera na-
tural en la resistencia a la tensión entre distintos componentes, debido a las diferencias
en los lotes de materia prima, en el proceso de fabricación y en los procedimientos de
medición, el ingeniero está interesado en estimar la resistencia a la tensión promedio
de los componentes. El conocimiento de las propiedades de muestreo estadı́sticas del
estimador utilizado, permite al ingeniero establecer la precisión del valor estimado.
Consideremos ahora una situación en la que se estudian dos tiempos de dedicación
a un curso, t1 y t2 . El investigador establece la conjetura de que el tiempo t1 dará
como resultado rendimientos mayores que t2 . La prueba estadı́stica de hipótesis es un
marco de referencia para resolver problemas de este tipo. En este caso, la hipótesis es
que el rendimiento promedio con el tiempo de estudio t1 es mayor que el rendimiento
promedio con el tiempo de estudio t2 . Notemos que no se hace hincapié en la estimación
de los rendimientos; en su lugar, la atención se centra en obtener conclusiones sobre la
hipótesis planteada.
Definición 1.1 (Población) Es un conjunto formado por la totalidad de las obser-

vaciones en las cuales se tiene cierto interés.
En cualquier problema particular, la población puede ser pequeña, grande pero

finita o infinita. El número de observaciones en la población recibe el nombre de tamaño
de la población. Por ejemplo, el ingreso de los habitantes de una ciudad, y el número de
botellas con un contenido menor de bebida en un dı́a de producción de una compañı́a de
gaseosas, son poblaciones de tamaño finito. Las observaciones obtenidas al medir todos
los dı́as el nivel de monóxido de carbono, es una población de tamaño infinito. Por
otra parte, un ingeniero puede considerar que la población de resistencias a la tensión
tiene una distribución normal con media µ y varianza σ 2 . Puede hacerse referencia a
este hecho diciendo que es una población normal o que es una población normalmente
distribuida.
En muchos problemas de inferencia estadı́stica, es imposible o poco práctico ob-
servar toda la población. Por ejemplo, no es posible medir el contenido de todas las
botellas producidas, ya que esto lleva mucho tiempo y tiene un costo alto. Por otra
parte, algunas (quizás muchas) de las botellas todavı́a no están llenas en el momento
en que tiene que tomarse una decisión, ası́ que, en gran medida, la población debe
verse como algo conceptual. En consecuencia, se depende de un subconjunto de las
observaciones provenientes de la población que sean de ayuda para tomar decisiones
sobre esta.
Definición 1.2 (Muestra) Es un subconjunto de observaciones seleccionadas de una

población.
7
Para que las inferencias sean válidas, la muestra debe ser representativa de la pobla-
ción. A menudo puede resultar atractivo seleccionar las observaciones más convenientes
como muestra o ejercitar el juicio en la selección de la muestra. Es frecuente que estos
procedimientos introduzcan un sesgo en la muestra, lo que trae como consecuencia que
el parámetro de interés sea subestimado (o sobrestimado) por la muestra. Por otra par-
te, no es posible describir de manera estadı́stica el comportamiento de una muestra de
este tipo. Para evitar estas dificultades, es deseable seleccionar una muestra aleatoria
como el resultado de un mecanismo aleatorio. En consecuencia, la selección de una
muestra es un experimento aleatorio, y cada observación de la muestra es el valor
observado de una variable aleatoria. Las observaciones en la población determinan la
distribución de probabilidad de la variable aleatoria.
Para definir una muestra aleatoria, sea X la variable aleatoria que representa el
resultado de tomar una observación de la población. Sea f (x) la función de probabi-
lidad de X. Supongamos que cada observación en la muestra se obtiene de manera
independiente, bajo las mismas condiciones. Es decir, las observaciones de la muestra
se obtienen al observar X de manera independiente bajo condiciones que no cambian,
por ejemplo n veces. Sea Xi la variable aleatoria que representa la i-ésima réplica. En-
tonces X1 , X2 , . . . , Xn constituyen una muestra aleatoria donde los valores numéricos
son x1 , x2 , . . . , xn . Las variables aleatorias en una muestra aleatoria son independien-
tes, con la misma distribución de probabilidad f (x) debido a que cada observación se
obtiene bajo las mismas condiciones. Es decir, las funciones de probabilidad marginal
de X1 , X2 , . . . , Xn son f (x1 ), f (x2 ), . . . , f (xn ), respectivamente, y por independencia,
la función de probabilidad conjunta de la muestra aleatoria es
fX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn ) = f (x1 )f (x2 ) . . . f (xn ).
Definición 1.3 (Muestra Aleatoria) Las variables aleatorias (X1 , X2 , . . . , Xn )

constituyen una muestra aleatoria de tamaño n, si
a) Las Xi son variables aleatorias independientes.
b) todas las Xi tienen la misma distribución de probabilidad.
Ejemplo 1 Supongamos que se investiga la duración efectiva de un componente

electrónico utilizado en un marcapaso cardı́aco, y que la duración del componente tiene
una distribución normal. Entonces se espera que cada una de las observaciones de la
duración del componente X1 , X2 , . . . , Xn en una muestra aleatoria de n componentes,
sean variables aleatorias independientes con la misma distribución normal. Después
de recopilar los datos, los valores numéricos de los tiempos de duración observados se
denotan por x1 , x2 , . . . , xn .
El propósito principal de la toma de una muestra aleatoria es obtener información

sobre los parámetros no conocidos de la población. Supongamos, por ejemplo, que
8 1. Introducción
se desea alcanzar una conclusión acerca de la población de habitantes del paı́s que
prefieren una marca particular de gaseosa. Sea p el valor no conocido de esta proporción.
Resulta poco práctico interrogar a cada persona de la población para determinar el
verdadero valor de p. Para hacer una inferencia con respecto a la proporción verdadera
p, un procedimiento más razonable consiste en seleccionar una muestra aleatoria (de
un tamaño apropiado) y utilizar la proporción observada p̂ de personas en la muestra
que prefieren cierta marca de gaseosa.
La proporción de la muestra, p̂, se calcula dividiendo el número de personas de
la muestra que prefieren una marca particular de gaseosa entre el tamaño total de la
muestra, n. Por lo tanto, p̂ es una función de los valores observados en la muestra
aleatoria. Puesto que es posible obtener muchas muestras aleatorias de una población,
el valor de p̂ cambiará de una a otra. Es decir, p̂ es una variable aleatoria. Esta variable
aleatoria se conoce como estadı́stica, estadı́grafo o estimador.
Definición 1.4 (Estadı́stica) Una estadı́stica es cualquier función de las observa-

ciones contenidas en una muestra aleatoria.
Ejemplo 2 Promedio (x), varianza (S 2 ), desviación estándar (S).
1.1. Distribuciones muestrales

La inferencia estadı́stica tiene que ver con la toma de decisiones sobre una población,
con base en la información contenida en una muestra aleatoria de esta. Por ejemplo,
supongamos que se tiene interés en el volumen promedio de lı́quido de un envase de
gaseosa. Se requiere que el volumen promedio de la población sea 300 ml. Un estadı́stico
toma una muestra aleatoria de 25 envases y calcula el volumen promedio en la muestra,
el cual resulta ser x = 298 ml. Es probable que el estadı́stico decida que la media de
la población es µ = 300 ml, a pesar de que la media de la muestra es 298 ml, ya que
sabe que la media muestral es un estimador razonable de µ y que es muy probable
obtener una media muestral de 298 ml, incluso si la media verdadera de la población
es µ = 300 ml. De hecho, si la media verdadera es 300 ml, entonces la prueba puede
repetirse con 25 envases, digamos cada 5 minutos, lo que producirá valores de x que
estarán por encima y por debajo de µ = 300 ml.
La media muestral es un estimador; es decir, una variable aleatoria que depende
de los resultados obtenidos en cada muestra particular. Dado que un estimador es una
variable aleatoria, entonces tiene una distribución de probabilidad.
Definición 1.5 La distribución de probabilidad de un estimador recibe el nombre de

distribución de muestreo.
Por ejemplo, la distribución de probabilidad de x se conoce como distribución de mues-

treo de la media.
1.1. Distribuciones muestrales 9
1.1.1. Distribución muestral de la media

Consideremos la determinación de la distribución de muestreo de la media muestral
X. Supongamos que se toma una muestra aleatoria de tamaño n de una población
normal con media µ y varianza σ 2 . Cada observación en esta muestra (por ejemplo
X1 , X2 , . . . , Xn ) es una variable aleatoria distribuida normal e independientemente,
con media µ y varianza σ 2 . Entonces, por la propiedad reproductiva de la distribución
normal, concluimos que la media muestral
X1 + X 2 + . . . + Xn
X=
n
tiene una distribución normal con media
µ + µ + ... + µ
µX = =µ
n
y varianza
2 σ2 + σ2 + . . . + σ2 σ2
σX = = .
n2 n
Si se muestrea una población que tiene una distribución de probabilidad desconocida,
la distribución de muestreo de la media muestral seguirá siendo aproximadamente
normal con media µ y varianza σ 2 /n, si el tamaño de la muestra n es grande.
NOTA: Propiedad reproductiva de la distribución normal.

Si X1 , X2 , . . . , Xp son v.a. normales independientes con E[Xi ] = µi y V [Xi ] =
2
σi , i = 1, p, entonces
Y = C 1 X1 + C 2 X 2 + . . . + C p Xp
es una v.a. normal con
E[Y ] = C1 µ1 + C2 µ2 + . . . + Cp µp
y
V [Y ] = C12 σ12 + C22 σ22 + . . . + Cp2 σp2 .
1.1.2. Teorema central del lı́mite

Teorema 1.1 Sea X1 , X2 , . . . , Xn una muestra aleatoria de tamaño n tomada de una
población (finita o infinita) con media µ y varianza finita σ 2 ; si n es lo bastante grande,
la distribución de muestreo de la media de la muestra X se puede aproximar con una
función de densidad normal.
La aproximación normal para X depende del tamaño n de la muestra. En la figura

1.1, la figura (a) presenta la distribución obtenida por los lanzamientos de un dado
equilibrado. Las probabilidades son iguales (1/6) para todos los valores obtenidos, 1, 2,
3, 4, 5 ó 6. La figura (b) presenta la distribución del puntaje promedio obtenido cuando
10 1. Introducción
se lanzan dos dados, y las figuras (c), (d) y (e) contienen la distribuciones de los pun-
tajes promedio obtenidos cuando se lanzan tres, cinco y diez dados, respectivamente.
Notemos que, si bien la población (un dado) está relativamente lejos de ser normal,
la distribución de los promedios queda aproximada, de manera razonablemente buena,
por la distribución normal, incluso para tamaños de muestra tan pequeños como cinco.
Aunque, en muchos casos, el teorema central del lı́mite funciona bien para muestras
pequeñas (n=4 ó 5), en particular donde la población es continua, unimodal y simétrica,
en otras situaciones se requiere muestras grandes, dependiendo de la forma que tenga
la población. En muchos casos de interés práctico, si n ≥ 30, la aproximación normal
será satisfactoria sin importar cuál sea la forma de la población. Si n < 30, el teorema
central del lı́mite funciona si la distribución de la población no está muy alejada de
una distribución normal.
Figura 1.1: Distribución de X según el número de dados lanzados.
Ejemplo 3 Una compañı́a de electrónica fabrica resistores que tienen una resistencia
promedio de 100 Ω (ohmios) y una desviación estándar de 10 Ω. La distribución de
la resistencia es normal. Encuéntrese la probabilidad de que al tomar una muestra de

n = 25 resistores, la resistencia promedio de éstos sea menor que 95 Ω.
Solución:
Ejemplo 4 Supongamos que una variable aleatoria X tiene la distribución uniforme

continua (
1/2 , 4 ≤ x ≤ 6
f (x) =
0 , en cualquier otro caso.
Encontrar la distribución de la media muestral de una muestra aleatoria de tamaño
n = 40.
Definición 1.6 (Error estándar) El error estándar de un estimador es la desvia-

ción estándar de su distribución de muestreo. Si el error estándar involucra parámetros
desconocidos cuyos valores pueden estimarse, la sustitución de estas estimaciones en
el error estándar da como resultado un error estándar estimado.
2
Ejemplo 5 Si X → N (µ, σ 2 ) ⇒ X → N (µ, σn ) y √σn es el error estándar.
s
Si σ 2 es desconocido, entonces σ
bX = √ es el error estándar estimado.
n
1.1.3. Distribución muestral de una proporción

Consideremos una población en la que la proporción de elementos poblacionales
portadores de una cierta caracterı́stica es p. Es decir, la población puede ser considerada
como una variable aleatoria X de modo que

1, si el elemento es portador de la caracterı́stica
X=
0, si el elemento no es portador de la caracterı́stica
Luego la media y la varianza de la población será:

µ = E[X] = p y σ 2 = V [X] = pq
en que consideramos a la distribución Bernoulli de la forma
x 0 1
p(x) q p
Definición 1.7 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población

con media E[X] = p y varianza V [X] = pq, y sea X1 + X2 + . . . + Xn la estadı́stica
que denota el número total de elementos portadores de la caracterı́stica de interés en la
muestra. La proporción de elementos portadores de la caracterı́stica de interés es dada
por
X 1 + X2 + . . . + X n X
pb = =
n n
en que X representa el número de elementos de la muestra portadores de la carac-
terı́stica de interés y n es el número total de elementos de la muestra.
La distribución muestral del estimador pb se denomina distribución muestral de una

proporción, cuya media y varianza son:

X1 + X 2 + . . . + Xn 1 1
µpb = E[b p] = E = E[X1 + X2 + . . . + Xn ] = np = p
n n n

X1 + X2 + . . . + Xn 1 1 pq
σp2b = V [b
p] = V = 2 V [X1 + X2 + . . . + Xn ] = 2 npq =
n n n n
Teorema 1.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población de

ensayos Bernoulli con parámetro p, y sea pb la proporción muestral.
a) Si el muestreo se hace con reemplazo o si la población es infinita, entonces:
E[bp] = p
pq
V [b
p] =
n
b) Si el muestreo se hace sin reemplazo de una población finita de tamaño N enton-

ces:
E[b
p] = p

pq N −n
V [b
p] =
n N −1
NOTAS:
a) Una regla práctica que se sigue con frecuencia establece que la distribución mues-
tral de pb es aproximadamente normal, si np > 5 y nq > 5.
N −n

b) El factor de corrección de población finita N −1
, se puede dejar de utilizar en
las aplicaciones prácticas cuando Nn ≤ 0,05.
c) Corrección por continuidad:
Proporción:
!
1
p0 + 2n −p
p ≤ p0 ) = P
P (b Z≤ p pq
n
!
1
p0 − 2n −p
p ≥ p0 ) = P
P (b Z≥ p pq
n
Binomial:
x + 12 − np

P (X ≤ x) = P Z ≤ √
npq
1
x − 2 − np

P (X ≥ x) = P Z ≥ √
npq
Ejemplo 6 Si de una población de adultos, el 15 % están sometidos a un tipo espe-

cial de dieta, cuál es la probabilidad de que una muestra de 100 personas muestre las
siguientes proporciones de individuos a dieta:
a) mayor o igual que 0,20.
b) entre 0,10 y 0,20.

Ejemplo 7 Un encuestador polı́tico efectúa un análisis de los resultados de la muestra

para hacer pronósticos para la elección. Supóngase que se trata de una elección con
dos candidatos; si un candidato especı́fico recibe cuando menos 52 % de los votos en la
muestra, entonces se pronosticará que ese candidato será el ganador de la elección. Si
se selecciona una muestra aleatoria de 600 votantes, ¿cuál es la probabilidad de que se
pronostique como ganador a ese candidato cuando,
a) el porcentaje real de sus votos es 50,3 %?
b) el porcentaje real de sus votos es 60 %?
1.1.4. Distribución muestral de la diferencia entre dos medias

muestrales
Consideremos el caso donde se tienen dos poblaciones independientes. Supongamos
que la primera población tiene una media µ1 y una varianza σ12 , mientras que la segunda
población tiene una media µ2 y una varianza σ22 . Supongamos además que ambas
poblaciones están normalmente distribuidas. Entonces, la distribución de muestreo de
X 1 − X 2 es normal con media
µX 1 −X 2 = µX 1 − µX 2 = µ1 − µ2
y varianza
2 2 2 σ12 σ22
σX 1 −X 2
= σX + σX = +
1 2n1 n2
Si las dos poblaciones no están distribuidas de manera normal, pero el tamaño de am-
bas muestras n1 y n2 es mayor que 30, entonces puede emplearse el teorema central del
lı́mite y suponer que X 1 y X 2 siguen, de manera aproximada, distribuciones normales

independientes. Por lo tanto, la distribución de muestreo de X 1 − X 2 es aproximada-
mente normal con media y varianza
2 σ12 σ22
µX 1 −X 2 = µ1 − µ2 y σX 1 −X 2
= +
n1 n2
Si n1 o n2 es menor que 30, entonces la distribución de muestreo de X 1 − X 2 seguirá

siendo aproximadamente normal, con media y varianza igual a lo mencionado anterior-
mente, siempre y cuando la población de la que se toma la muestra pequeña no se aleje
de manera importante de la población normal.
Definición 1.8 Si se tienen dos poblaciones independientes con medias µ1 y µ2 , y

varianzas σ12 y σ22 , y si X 1 y X 2 son las medias muestrales de dos muestras aleatorias
independientes de tamaños n1 y n2 de estas poblaciones, entonces la distribución de
muestreo de
X 1 − X 2 − (µ1 − µ2 )
Z= q 2
σ1 σ2
n1
+ n22
es aproximadamente normal estándar, si se aplican las condiciones del teorema central
del lı́mite. Si las dos poblaciones son normales, entonces la distribución de muestreo
de Z es, de manera exacta, normal estándar.
Ejemplo 8 La vida eficaz de un componente utilizado en la turbina de una aeronave

es una variable aleatoria con media 5000 horas y desviación estándar de 40 horas. La
distribución de la vida eficaz es muy próxima a una distribución normal. El fabricante
de la turbina introduce una mejora en el proceso de fabricación de este componente,
que aumenta el tiempo de vida útil promedio a 5050 horas y disminuye la desviación
estándar a 30 horas. Supongamos que se toma del proceso “antiguo” una muestra alea-
toria de n1 = 16 componentes, y una muestra aleatoria del proceso “mejorado” de
n2 = 25 componentes. ¿Cuál es la probabilidad de que la diferencia entre las dos me-
dias muestrales X 2 − X 1 sea al menos 25 horas? Supóngase que los procesos antiguo y
mejorado pueden considerarse como poblaciones independientes.

Distribuciones Muestralesp1

Cargado por

Copyright:

Formatos disponibles

Distribuciones Muestralesp1

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Distribuciones Muestralesp1

Cargado por

Copyright:

Formatos disponibles

Capı́tulo 1

Introducción: El campo de la inferencia estadı́stica está formado por los métodos

La inferencia estadı́stica puede dividirse en dos grandes áreas: Estimación de

parámetros y prueba de hipótesis. Por ejemplo, un problema de estimación es el siguien-

Definición 1.1 (Población) Es un conjunto formado por la totalidad de las obser-

En cualquier problema particular, la población puede ser pequeña, grande pero

Definición 1.2 (Muestra) Es un subconjunto de observaciones seleccionadas de una

fX1 ,X2 ,...,Xn (x1 , x2 , . . . , xn ) = f (x1 )f (x2 ) . . . f (xn ).

Definición 1.3 (Muestra Aleatoria) Las variables aleatorias (X1 , X2 , . . . , Xn )

a) Las Xi son variables aleatorias independientes.

b) todas las Xi tienen la misma distribución de probabilidad.

Ejemplo 1 Supongamos que se investiga la duración efectiva de un componente

El propósito principal de la toma de una muestra aleatoria es obtener información

Definición 1.4 (Estadı́stica) Una estadı́stica es cualquier función de las observa-

Ejemplo 2 Promedio (x), varianza (S 2 ), desviación estándar (S).

1.1. Distribuciones muestrales

Definición 1.5 La distribución de probabilidad de un estimador recibe el nombre de

Por ejemplo, la distribución de probabilidad de x se conoce como distribución de mues-

1.1.1. Distribución muestral de la media

NOTA: Propiedad reproductiva de la distribución normal.

1.1.2. Teorema central del lı́mite

La aproximación normal para X depende del tamaño n de la muestra. En la figura

Figura 1.1: Distribución de X según el número de dados lanzados.

la resistencia es normal. Encuéntrese la probabilidad de que al tomar una muestra de

Ejemplo 4 Supongamos que una variable aleatoria X tiene la distribución uniforme

Definición 1.6 (Error estándar) El error estándar de un estimador es la desvia-

1.1.3. Distribución muestral de una proporción

Luego la media y la varianza de la población será:

Definición 1.7 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población

La distribución muestral del estimador pb se denomina distribución muestral de una

Teorema 1.2 Sea X1 , X2 , . . . , Xn una muestra aleatoria extraı́da de una población de

a) Si el muestreo se hace con reemplazo o si la población es infinita, entonces:

b) Si el muestreo se hace sin reemplazo de una población finita de tamaño N enton-

c) Corrección por continuidad:

Ejemplo 6 Si de una población de adultos, el 15 % están sometidos a un tipo espe-

a) mayor o igual que 0,20.

b) entre 0,10 y 0,20.

Ejemplo 7 Un encuestador polı́tico efectúa un análisis de los resultados de la muestra

a) el porcentaje real de sus votos es 50,3 %?

b) el porcentaje real de sus votos es 60 %?

1.1.4. Distribución muestral de la diferencia entre dos medias

lı́mite y suponer que X 1 y X 2 siguen, de manera aproximada, distribuciones normales

Si n1 o n2 es menor que 30, entonces la distribución de muestreo de X 1 − X 2 seguirá

Definición 1.8 Si se tienen dos poblaciones independientes con medias µ1 y µ2 , y

Ejemplo 8 La vida eficaz de un componente utilizado en la turbina de una aeronave

También podría gustarte