Desarrollo Tematico de La Unidad III
Desarrollo Tematico de La Unidad III
Desarrollo Tematico de La Unidad III
Las distribuciones de frecuencias como una forma útil de resumir las variaciones en los datos
observados. Las distribuciones de probabilidad están relacionadas con las distribuciones de
frecuencias. Una distribución de frecuencias teórica es una distribución de probabilidades que
describe la forma en que se espera varíen los resultados. Como estas distribuciones representan
expectativas de que algo suceda, resultan modelos útiles para hacer inferencias y tomar decisiones
en condiciones de incertidumbre.
En una distribución de probabilidad continua, la variable que se está considerando puede tomar
cualquier valor dentro de un intervalo dado. Suponga que estamos examinando el nivel de
afluencia de un cierto número de arroyos, y medimos este nivel en partes de afluencia por
millones de partes de agua. Podríamos esperar un intervalo bastante continuo de partes por millón
(ppm), en todas las corrientes, desde los niveles más bajos en los pequeños arroyos de montaña
hasta niveles en extremo altos en los arroyos contaminados. De hecho, sería muy normal que la
variable “partes por millón” tomara una cantidad enorme de valores. Podríamos decir que la
distribución de esta variable (ppm) es una distribución continua. Las distribuciones continuas son
una forma conveniente de presentar distribuciones discretas que tienen muchos resultados
posibles, todos muy cercanos entre sí.
Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio,
esta puede ser discreta o continua. Es decir, una variable aleatoria es una especie de valor o
magnitud que cambia de una ocurrencia a otra sin seguir una secuencia predecible.
Por ejemplo, en una clínica para tratamiento del cáncer de mama no se tiene manera de saber con
exactitud cuántas mujeres van a ser atendidas en un día cualquiera,de modo que el número de
mujeres del día siguiente es una variable aleatoria. Si los registros diarios de la clínica indican que
los valores de la variable aleatoria van desde 100 hasta 115 mujeres al día, entonces ésta es una
variable aleatoria discreta.
La Tabla 1 lista el número de veces que se ha alcanzado cada nivel durante los últimos 100 días.
Si los pasados 100 días es un comportamiento típico, es posible utilizar el registro para asignar
una probabilidad a cada número posible de mujeres y encontrar una distribución de probabilidad,
para ello se normalizan los datos ( se divide cada valor de la frecuencia entre 100, el número total
de días en que se tomaron los registros); la suma de todas las probabilidades calculadas deben
sumar 1.
Tabla 1 Número de mujeres examinadas durante 100 días
Para obtener el valor esperado de una variable aleatoria discreta, se multiplica cada valor que la
variable puede tomar por la probabilidad de ocurrencia de ese valor y luego se suman los
productos. La tabla 2 ilustra este procedimiento para el caso de la clínica. El total de la tabla indica
que el valor esperado de la variable aleatoria discreta “Número de mujeres examinadas al día” es
de 108.02 mujeres. Que significa que en un periodo largo, el número de mujeres examinadas
diariamente deberá tener un promedio de aproximadamente 108.02. Este valor no significa que
mañana 108.02 mujeres asistan a la clínica.
La directora de la clínica podría basar sus decisiones en el valor esperado del número de mujeres
examinadas diariamente debido a que éste es un promedio ponderado de los resultados que espera
en el futuro.
Tabla 2 Cálculo del valor esperado de la variable aleatoria discreta “Número de mujeres
examinadas al día".
Esta distribución describe una variedad de procesos de interés para los administradores. Por otra
parte, describe datos discretos, no continuos, que son resultado de un experimento conocido como
proceso de Bernoulli.
Considerar que
Ejemplo:
Las posibilidades de obtener exactamente dos caras (en cualquier orden) en tres lanzamientos de
una moneda no alterada. Simbólicamente, se expresan los valores de la forma:
Sustituyendo en la formula:
Ejemplo
La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores
ya la han leido. Un grupo de 4 amigos son aficionados a la lectura:
n=4
p = 0.8
q = 0.2
b) ¿Y cómo máximo 2?
E jem pl o
Media
Varianza
Desviación típica
La probabilidad de que un artículo producido por una fabrica sea defectuoso es 0.02. Se envió un
cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos
defectuosos, la varianza y la desviación típica.
La distribución de Poisson se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribución de llamadas telefónicas que llegan a un conmutador, las solicitudes de
pacientes que requieren servicio en una institución de salud, las llegadas de camiones y
automóviles a una caseta de cobro, y el número de accidentes registrados en cierta intersección.
Estos ejemplos tienen en común un elemento: pueden ser descritos mediante una variable aleatoria
discreta que toma valores enteros (0, 1, 2, 3, 4, 5, etc).
El número de vehículos que pasan por una sola caja de una caseta de cobro en una hora pico sirve
a. La probabilidad de que exactamente un vehículo llegue a una caja por segundo es muy
pequeña y es constante para cada intervalo de un segundo.
Formula
Ejemplo
Suponga que se esta investigando la seguridad de una peligrosa intersección. Los registros
policiacos indican una media de cinco accidentes mensuales en esta intersección. El número de
accidentes está distribuido de acuerdo con una distribución de Poisson, y el Departamento de
Seguridad de Tránsito desea que se calcule la probabilidad de que en cualquier mes ocurran
exactamente 0, 1, 2, 3 o 4 accidentes. Podemos utilizar la Tabla 3 para evitar tener que calcular e
elevadas a potencias negativas. Aplicando la fórmula
En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que
al sacar 2 bolas las dos sean blancas?
Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos
posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que
los distintos ensayos son dependientes entre sí:
Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca,
en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes
(hay dependencia entre los distintos ensayos).
Donde:
Donde:
Ejemplo
En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3
sean blancas?
N = 12; N1 = 7; N2 = 5; k = 3; n = 4
Aplicando el modelo:
Por lo tanto, P (x = 3) = 0.3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35.3%.
1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la forma de campana.
total bajo la curva es 1.00, de manera que se puede pensar en áreas bajo la curva como si fueran
probabilidades. Matemáticamente es verdad que:
En la Tabla 4 muestra el área bajo la curva normal entre la media y cualquier valor de la variable
aleatoria normalmente distribuida. Observar en la tabla la localización de la columna identificada
con z. El valor de z se deriva de la fórmula:
donde,
x = valor de la variable aleatoria que nos preocupa.
Tabla 4 Áreas bajo la curva de distribución de probabilidad normal estándar, entre la media y
valores positivos de z
Ejemplo
Se tiene un programa de entrenamiento diseñado para mejorar la calidad de las habilidades de los
supervisores de línea de producción. Debido a que el programa es autoadministrado, los
supervisores requieren un número diferente de horas para terminarlo. Un estudio de los
participantes anteriores indica que el tiempo medio para completar el programa es de 500 horas, y
que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas.
a) ¿Cuál es la probabilidad de que un participante elegido al azar requiera más de 500 horas
para completar el programa?
Figura 2 Distribución del tiempo requerido para completar el programa de entrenamiento,
con el intervalo más de 500 horas sombreado
En la Figura 2, se observa que la mitad del área bajo la curva está localizada a ambos lados de la
media de 500 horas. Por tanto, se puede deducir que la probabilidad de que la variable aleatoria
tome un valor mayor a 500 es el área sombreada, es decir, 0.5.
b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650 horas
para completar el programa de entrenamiento?
La probabilidad que responderá a esta pregunta está representada por el área con pantalla gris
entre la media (500 horas) y el valor x, en el cual estamos interesados (650 horas). El valor para z,
se calcula de la siguiente manera:
Al buscar z= 1.5 en la Tabla 4, se encuentra una probabilidad de 0.4332. En consecuencia, la
probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para terminar el
programa de entrenamiento es ligeramente mayor a 0.4.
c) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome más de 700 horas en
completar el programa?
Ahora interesa el área sombreada a la derecha del valor “700 horas”. Al utilizar la formula para el
calculo de Z, se obtiene:
Al buscar en la Tabla 4 un valor de z igual a 2.0, se encuentra una probabilidad de 0.4772. Esto
representa la probabilidad de que el programa tome entre 500 y 700 horas. Sin embargo, se desea
tener la probabilidad de que tome más de 700 horas. Puesto que la mitad derecha de la curva
(entre la media y la cola derecha) representa una probabilidad de 0.5, se puede obtener la respuesta
(el área que se encuentra a la derecha del punto correspondiente a 700 horas) si se resta 0.4772 de
0.5; 0.5000 - 0.4772 = 0.0228. Por tanto, hay un poco más de dos oportunidades en 100 de que un
participante elegido al azar se lleve más de 700 horas en completar el curso.
El valor de z igual a 1.5 de la Tabla 4, se encuentra una probabilidad de 0.4332 (la probabilidad de
que la variable aleatoria esté entre la media y 650 horas). Ahora, para el segundo paso se calcula
un valor de z para el punto correspondiente a 550 horas, así:
De la Tabla 4 se obtiene que el valor z igual a 0.5 tiene una probabilidad de 0.1915 (la posibilidad
de que la variable aleatoria caiga entre la media y 550 horas). Para responder la pregunta, se debe
realizar la resta siguiente:
La probabilidad de que un candidato elegido al azar se tome entre 550 y 650 horas para completar
el programa de entrenamiento es un poco menor de 1 entre 4.
Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad
y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:
4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha;
esto es, están sesgadas a la derecha.
La siguiente figura ilustra tres distribuciones X 2. Notar que el valor modal aparece en el valor (n-
3) = (gl-2).
La tabla que se utilizará para estos apuntes es la del libro “ESTADÍSTICA PARA
ADMINISTRACIÓN Y ECONOMÍA”, Séptima edición de Levin, Richard I. Y Rubin, David S.,
la cual da valores críticos X2 u(gl) para veinte valores especiales de σ. Para denotar el valor crítico
de una distribución X2 con gl grados de libertad se usa el símbolo X 2 (gl); este valor crítico
determina a su derecha un área de σ bajo la curva X2 y sobre el eje horizontal. Por ejemplo para
encontrar X20.05 en la tabla se localiza 6 gl en el lado izquierdo y σ=0.05 a o largo del lado superior
de la misma tabla.
Cálculo de Probabilidad
El cálculo de probabilidad en una distribución muestral de varianzas sirve para saber como se va a
comportar la varianza o desviación estándar en una muestra que proviene de una distribución
normal.
Ejemplos
1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en
una ciudad grande forman una distribución normal con una desviación estándar σ=1 minuto.
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.
Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:
Solución.
Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el
valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la
derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95
menos 0.01 quedando 0.94.
Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.
Ejemplos:
1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas
por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un
intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que
distribuye esta compañía, suponga una población normal.
Solución:
Para obtener un intervalo de confianza de 95% se elige un α= 0.05. Después con el uso de la
tabla con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la gráfica anterior que el valor de X 2 corre en forma normal, esto es de
izquierda a derecha.
Gráficamente:
Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. Con un
nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de
semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.
Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos
resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.
Si X es una variable aleatoria binomial con media μ = np y varianza σ2 = npq, entonces la forma
limitante de la distribución de
Ejemplo
Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad de recuperarse.
Si se sabe que 100 personas contrajeron esta enfermedad, ¿cuál es la probabilidad de que
sobrevivan menos de 30?
Solución
Se representa con la variable binomial X el número de pacientes que sobreviven. Como n = 100,
se debe de obtener resultados muy precisos usando la aproximación de la curva normal con
Para obtener la probabilidad que se desea, tenemos que calcular el área a la izquierda de x = 29.5.
El valor z que corresponde a 29.5 es
y la probabilidad de que menos de 30 de los 100 pacientes sobrevivan está dada por la región
sombreada en la Figura, por lo tanto,
Ejemplo
Un examen de opción múltiple tiene 200 preguntas, cada una con 4 respuestas posibles, de las que
sólo una es la correcta. ¿Cuál es la probabilidad de que solamente adivinando se obtengan de 25 a
30 respuestas correctas para 80 de los 200 problemas sobre los que el estudiante no tiene
conocimientos?
Solución
La probabilidad de adivinar una respuesta correcta para cada una de las 80 preguntas es p = 1/4. Si
X representa el número de respuestas correctas sólo porque se adivinaron, entonces,