Tema I
Tema I
Tema I
EN LOGISTICA
estadística inferencial es llegar a conclusiones que brinden una adecuada base científica
para la toma de decisiones, considerando la información muestral recolectada.
En otras palabras la estadística inferencial se ocupa del análisis, interpretación de los
resultados y de las conclusiones a las que se puede llegar a partir de la información obtenida
de una muestra con el fin de extender sus resultados a la población bajo estudio. La
generalización de las conclusiones obtenidas en una muestra a toda la población está sujeta a
riesgo por cuanto los elementos de la muestra son obtenidos mediante un muestreo
probabilístico.
La estadística inferencial provee los procedimientos para efectuar la inferencia inductiva y
medir la incertidumbre de las conclusiones que se van a generalizar. Los problemas más
importantes en este proceso son:
Estimación Puntual: Es la estimación del valor del parámetro por medio de un único
valor obtenido mediante el cálculo o evaluación de un estimador para una muestra
específica.
Por ejemplo: Si se quiere determinar en cuál de las ciudades, Monterrey o Guadalajara,
el sueldo semanal promedio de un empleado es mayor.
Estimación por intervalos: Es la estimación del valor de un parámetro mediante un
conjunto de valores contenidos en un intervalo. Para la obtención de intervalos de
confianza se debe considerar el coeficiente de confianza que es la probabilidad de que el
intervalo contenga al parámetro poblacional.
Prueba de Hipótesis: Es el procedimiento estadístico de comprobación de una
afirmación y se realiza a través de las observaciones de una muestra aleatoria.
El objetivo de la inferencia estadística es hacer inferencias acerca de una población basada en
la información contenida en una muestra. Ahora considerando que las poblaciones están
caracterizadas por medidas descriptivas numéricas llamadas parámetros, a la inferencia
estadística le corresponde hacer inferencias acerca de los parámetros poblacionales.
Además de lo anterior, vemos que el buen muestreo es indispensable para los problemas
estadísticos donde el estudio de toda la población resulta ser muy caro o, en los casos en que
la información se destruye, no sería factible. Por ejemplo, en el control de calidad sobre la vida
media de las bombillas se llevan a cabo pruebas de tipo destructivo puesto que la muestra se
analiza hasta que las bombillas dejen de funcionar.
En muchas situaciones, el muestreo produce resultados más exactos que en un censo (un
censo se lleva a cabo cuando es indispensable analizar todos los casos de una población), dado
que la pesada carga de trabajo de procesar la información de un censo produce una gran
fatiga que, a su vez, puede ser la responsable de prácticas poco adecuadas por parte de los
investigadores. Asimismo, la población puede ser muy dinámica y no mantenerse en un estado
el tiempo necesario para medir sus características.
Por otro lado, existe infinidad de casos de laboratorio o experimentos que no tienen todos los
datos de la población, ya que ocurren solo con las repeticiones de los experimentos que
pueden ser infinitas. En este sentido, es necesario saber, ¿qué entendemos por muestreo?
El muestreo es simplemente un conjunto de métodos para obtener muestras.
Pero, ¿qué buscamos con el muestreo? Obtener con el mínimo costo, la máxima información
sobre las medidas de la población (parámetros). En otras palabras, encontrar con una muestra
pequeña la mayor información posible de los parámetros.
Al usar un muestreo deben tomarse las precauciones necesarias para asegurar la aleatoriedad
de las muestras. Por consiguiente, existen diferentes técnicas para llevarlo a cabo. A
continuación se mencionan lo más común en los muestreos probabilísticos.
Muestreo aleatorio simple
Cuando hablamos de un muestreo aleatorio simple debe entenderse un muestreo sin
reemplazo. El muestreo aleatorio simple se recomienda cuando las características de interés
presentan gran homogeneidad, pues en caso contrario su uso requeriría muestras grandes,
para lograr una precisión aceptable. Además, cuando se presenta cierta heterogeneidad en los
datos podrían seleccionarse muestras indeseables.
El muestreo aleatorio simple es aquel método que asigna la misma probabilidad de selección a
todas y cada una de las muestras posibles y distintas. Siendo esta probabilidad 1/C Nn , donde N
representa al tamaño de la población y n, el tamaño de la muestra.
Una forma equivalente de seleccionar la muestra es elegir las unidades de una en una y en
forma consecutiva y asignar una probabilidad de selección a las unidades en cada caso.
Ejemplo: Muestreo aleatorio simple
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
Tamaño de la muestra
De manera errónea se piensa que existe una fórmula mágica para calcular el valor deseado de
muestra que sea posible aplicar a cualquier situación o investigación. En general, los
investigadores y estudiantes de áreas aplicadas requieren conocer el tamaño ideal de una
muestra para realizar el estudio de campo de la investigación que llevan a cabo. Existen
diferentes técnicas para determinar el tamaño de la muestra, también hay diferentes
situaciones. Pero, siempre debe tenerse en cuenta que las muestras deben cumplir estas
características:
Representativa. Todos y cada uno de los elementos de la población deben tener la
misma oportunidad de ser tomados en cuenta para conformar la muestra.
Adecuada y válida. El error de la muestra debe ser el mínimo posible respecto de la
población.
Confiable. El tamaño de la muestra debe obtenerse mediante algún proceso
matemático que elimine la incidencia del error.
Podemos establecer que el cálculo del tamaño de la muestra resulta ser uno de los
aspectos clave en la fase previa de cualquier investigación científica o de mercado, ya que
con ésta es posible determinar el grado de credibilidad que podemos asignar a los
resultados de la investigación. Además, al elegir un buen tamaño de muestra y una técnica
adecuada de muestreo, implícitamente hemos reunido información que cumple las
características enunciadas antes para una muestra: representativa, válida y confiable a un
costo mínimo.
I.3 Teorema del límite central.
Cuando se seleccionan muestras aleatorias simples de tamaño n de una población,
la distribución muestral de la media muestral puede aproximarse a una
distribución normal a medida que el tamaño de la muestra se hace grande.
NOTA: La distribución normal es un modelo teórico capaz de aproximar satisfactoriamente el
valor de una variable aleatoria a una situación ideal. En otras palabras, la distribución normal
adapta una variable aleatoria a una función que depende de la media y la desviación típica. Es
decir, la función y la variable aleatoria tendrán la misma representación pero con ligeras
diferencias.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
En la figura siguiente se muestra cómo funciona el teorema del límite central en tres
poblaciones diferentes; cada columna se refiere a una de las poblaciones. En el primer renglón
de la figura se muestra que ninguna de las tres poblaciones está distribuida normalmente. La
población I tiene una distribución uniforme. A la población II se le conoce como distribución en
forma de orejas de conejo. Esta distribución es simétrica, pero los valores más probables se
encuentran en las colas de la distribución. La forma de la población III se parece a una
distribución exponencial; es sesgada a la derecha.
ILUSTRACION DEL TEOREMA DE LIMITE CENTRAL CON TRES POBLACIONES
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
En los tres renglones siguientes de la figura se muestran las formas de las distribuciones
muestrales para tamaños de muestras n = 2, n = 5 y n = 30. Cuando el tamaño de la muestra es
2, se observa que cada distribución muestral tiene una forma diferente a la distribución
poblacional correspondiente. Con muestras de tamaño 5, se observa que las formas de las
distribuciones muestrales en los casos de las poblaciones I y II empiezan a parecerse a la forma
de una distribución normal. En el caso de la población III, aun cuando la forma de la
distribución muestral empieza a ser parecida a una distribución normal, todavía se observa
cierto sesgo a la derecha.
Por último, para muestras de tamaño 30, la forma de cada una de las tres distribuciones
muestrales es aproximadamente normal.
Desde el punto de vista de la práctica, será conveniente saber qué tan grande necesita ser el
tamaño de la muestra para que aplique el teorema del límite central y pueda suponer que la
forma de la distribución muestral es aproximadamente normal. En las investigaciones
estadísticas se ha estudiado este problema en distribuciones muestrales de x de muy diversas
poblaciones y para muy diversos tamaños de muestras. Lo que se acostumbra a hacer en la
práctica es suponer que, en la mayor parte de las aplicaciones, la distribución muestral de x se
puede aproximar mediante una distribución normal siempre que la muestra sea de tamaño 30
o mayor. En los casos en que la población es muy sesgada o existen observaciones atípicas,
pueden necesitarse muestras de tamaño 50. Por último, si la población es discreta, el tamaño
de muestra necesario para la aproximación normal suele depender de la proporción
poblacional.
Si tomamos muestras de una población con distribución desconocida, ya sea finita o infinita, la
distribución muestral de X aun será aproximadamente normal con media µ y varianza σ2/n,
siempre que el tamaño de la muestra sea grande. Este resultado es una consecuencia
inmediata del teorema del límite central.
La aproximación normal para X por lo general será buena si n ≥ 30, siempre y cuando la
distribución de la población no sea muy asimétrica. Si n < 30, la aproximación será buena solo
si la población no es muy diferente de una distribución normal y, como antes se estableció, si
se sabe que la población es normal, la distribución muestral de X seguirá siendo una
distribución normal exacta, sin importar que tan pequeño sea el tamaño de las muestras.
El tamaño de la muestra n = 30 es un lineamiento para el teorema del límite central. Sin
embargo, como indica el planteamiento del teorema, la suposición de normalidad en la
distribución de X se vuelve más precisa a medida que n se hace más grande.
Ejemplo: Una empresa de material eléctrico fabrica bombillas que tienen una duración que se
distribuye aproximadamente en forma normal, con media de 800 horas y desviación estándar
de 40 horas. Calcule la probabilidad de que una muestra aleatoria de 16 bombillas tenga una
vida promedio de menos de 775 horas.
Solución:
La distribución muestral de X será aproximadamente normal, con µ x = 800 y σ x = 40/√ 16= 10.
La probabilidad que se desea es determinada por el área de la región sombreada de la
siguiente figura.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
775−800
z= = -2.5,
10
EJERCICIOS:
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
El teorema del límite central se puede ampliar fácilmente al caso de dos muestras y dos
poblaciones.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
Si tanto n1 como n2 son mayores o iguales que 30, la aproximación normal para la distribución
de X 1 y X 2 es muy buena cuando las distribuciones subyacentes no están tan alejadas de la
normal. Sin embargo, aun cuando n1 y n2 sean menores que 30, la aproximación normal es
hasta cierto punto buena, excepto cuando las poblaciones no son definitivamente normales.
Por supuesto, si ambas poblaciones son normales, entonces X 1 y X 2 tienen una distribución
normal sin importar de qué tamaño sean n1 y n2.
Ejemplo:
Supongamos que los salarios de dos poblaciones, una de hombres y otra de mujeres, siguen
una distribución Normal N(914, 42) y N(883, 30), respectivamente. Escojamos al azar una
muestra de 40 hombres y una muestra de 30 mujeres. ¿Cuál es la probabilidad de que el
sueldo medio de los hombres supere al de las mujeres en 36 euros?
Solución: Como X1 y X2 siguen una distribución Normal, la variable aleatoria X 1 − X2 sigue
también una distribución Normal:
https://calculo.cc/temas/temas_estadistica/muestreo/problemas/
prob_distribuciones2.html
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
https://www.coursehero.com/file/36624061/Trabajo-Estadistica-1/
EJERCICIOS
1. Cada día, miles de personas en un aeropuerto pasan por un control de seguridad en uno de
dos niveles: el nivel A o el nivel B. Supón que, en promedio, a las personas les toma 26
minutos pasar por el control de seguridad en el nivel A con una desviación estándar de 7.5
minutos. En el nivel B, la media y la desviación estándar son de 24 y 4 minutos,
respectivamente.
Cada día, en el aeropuerto ven muestras aleatorias separadas de 100 personas de cada nivel.
a) Calcula la media y la desviación estándar (en minutos) de la distribución muestral de
X A - X B.
b) Calcula P ( X A - X B > 2.0), donde X A y X B son los tiempos promedio que tardan en pasar
por cada control de seguridad.
2. El responsable de la sede central de una empresa afirma que las edades de sus empleados
siguen una distribución normal con una media de 41 años y una desviación típica de 5 años.
Por otro lado, el responsable de una sede de las sucursales de dicha empresa en otro país,
ha determinado que sus empleados también tienen edades que se ajustan a una
distribución normal con una media de 39 años y desviación típica de 3 años.
Con el fin de hacer un estudio comparativo se seleccionan muestras de 40 personas de cada
sede de la empresa.
a) Determina la distribución para la diferencia de las medias muestrales.
b) ¿Cuál es la probabilidad de que los empleados de la sede central tengan una media de
edad de al menos 3 años mayor que los de la sucursal extranjera?
3. Las pruebas de control de calidad para un modelo A de lámparas han determinado que la
duración se distribuye como una normal de media 3300 horas y desviación típica 180 horas;
mientras que para otro modelo B la duración media es de 3200 horas y desviación típica
155 horas.
Si se toman muestras aleatorias de 100 lámparas de cada modelo:
a) ¿Cuáles son los parámetros de media y desviación típica de la diferencia de las medias
muestrales?
b) Halla la probabilidad de que la diferencia de las medias de las duraciones de las
bombillas de cada modelo sea inferior a 40 horas.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
x− p
Desviación media de la binomial z=
√ P (1− p)
Debe agregarse un factor de corrección si se trata de una muestra finita obtenida sin
reemplazamiento.
Factor de corrección:
√ N −n
N −1
Donde:
p es la proporción de la muestra,
P es la media de la proporción,
n es el tamaño de la muestra,
x es el valor buscado y
N es el tamaño de la población
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
Ejemplo
Se ha determinado que 60% de los estudiantes de una universidad grande fuman cigarrillos. Se
toma una muestra aleatoria de 800 estudiantes. Calcule la probabilidad de que la proporción
de la muestra de la gente que fuma cigarrillos sea menor que 0.55.
Solución:
Media de proporciones: μ p=P=np = 800 X 0.6 = 480
Factor de corrección:
√ N −n
N −1
=
√ 800−480
800−1
=
√ 320
799
= 0.63
EJERCICIOS
1. Un medicamento para malestar estomacal tiene la advertencia de que algunos
usuarios pueden presentar una reacción adversa a él, más aún, se piensa que
alrededor del 3% de los usuarios tienen tal reacción. Si una muestra aleatoria de
150 personas con malestar estomacal usa el medicamento, encuentre la
probabilidad de que la proporción de la muestra de los usuarios que realmente
presentan una reacción adversa, exceda el 4%.
4. Suponer que de la gente que solicita ingresar a una compañía, 40% pueden
aprobar un examen de aritmética para obtener el trabajo. Si se tomara una
muestra de 20 solicitantes, ¿Cuál sería la probabilidad de que 50% o más de
ellos aprobaran?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con dos proporciones
muestrales, la distribución muestral de diferencia de proporciones es aproximadamente
normal para tamaños de muestra grande. Entonces p 1 y p2 tienen distribuciones muestrales
aproximadamente normales, así que su diferencia p1-p2 también tiene una distribución
muestral aproximadamente normal.
En el subtema 1.4.3 revisamos la distribución muestral de proporciones y se comprobó que:
μ p −μ p =P1−P2
1 2
y
σ
p1−¿ p =
2
√ P1 q 1 P 2 q 2
n1
+
n2
¿
Ejemplo 1.
Los hombres y mujeres adultos radicados en Monterrey difieren en sus opiniones sobre la
promulgación de la pena de muerte para personas culpables de asesinato. Se cree que el 12%
de los hombres adultos están a favor de la pena de muerte, mientras que sólo 10% de las
mujeres adultas lo están. Si se pregunta a dos muestras aleatorias de 100 hombres y 100
mujeres su opinión sobre la promulgación de la pena de muerte, determine la probabilidad de
que el porcentaje de hombres a favor sea al menos 3% mayor que el de las mujeres.
TEMA I ESTADISTICA INFERENCIAL I ING. EN LOGISTICA
Se recuerda que se está incluyendo el factor de corrección de 0.5 por ser una distribución
binomial y se está utilizando la distribución normal.
EJERCICIOS
1. Se sabe que 3 de cada 6 productos fabricados por la máquina 1 son defectuosos
y que 2 de cada 5 objetos fabricados por la máquina 2 son defectuosos; se
toman muestras de 120 objetos de cada máquina:
a) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 2 rebase a la máquina 1 en por lo menos 0.10?
b) ¿cuál es la probabilidad de que la proporción de artículos defectuosos de la
máquina 1 rebase a la máquina 2 en por lo menos 0.15?