Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Desarrollo Tematico de La Unidad III

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 26

Unidad III.- Tipos de distribuciones variables aleatorias discretas y continuas.

3.1 Distribuciones de probabilidad para variables discretas

Las distribuciones de frecuencias como una forma útil de resumir las variaciones en los datos
observados. Las distribuciones de probabilidad están relacionadas con las distribuciones de
frecuencias. Una distribución de frecuencias teórica es una distribución de probabilidades que
describe la forma en que se espera varíen los resultados. Como estas distribuciones representan
expectativas de que algo suceda, resultan modelos útiles para hacer inferencias y tomar decisiones
en condiciones de incertidumbre.

Las distribuciones de probabilidad se clasifican como discretas y continuas. En la distribución de


probabilidad discreta está permitido considerar sólo un número limitado de valores. En la Figura 1
se muestra un ejemplo de distribución de probabilidad discreta, en la que se expresan las ideas de
la candidata sobre las elecciones que se avecinan. En ella, los votos pueden tomar sólo cuatro
valores posibles (1,000, 2,000, 3,000 o 4,000). De manera análoga, la probabilidad de que una
persona haya nacido en un mes dado es también discreta, puesto que sólo hay 12 posibles valores
(los 12 meses del año).

Figura 1 Distribución de probabilidad del número de votos

En una distribución de probabilidad continua, la variable que se está considerando puede tomar
cualquier valor dentro de un intervalo dado. Suponga que estamos examinando el nivel de
afluencia de un cierto número de arroyos, y medimos este nivel en partes de afluencia por
millones de partes de agua. Podríamos esperar un intervalo bastante continuo de partes por millón
(ppm), en todas las corrientes, desde los niveles más bajos en los pequeños arroyos de montaña
hasta niveles en extremo altos en los arroyos contaminados. De hecho, sería muy normal que la
variable “partes por millón” tomara una cantidad enorme de valores. Podríamos decir que la
distribución de esta variable (ppm) es una distribución continua. Las distribuciones continuas son
una forma conveniente de presentar distribuciones discretas que tienen muchos resultados
posibles, todos muy cercanos entre sí.

El valor esperado de una variable aleatoria

Una variable es aleatoria si toma diferentes valores como resultado de un experimento aleatorio,
esta puede ser discreta o continua. Es decir, una variable aleatoria es una especie de valor o
magnitud que cambia de una ocurrencia a otra sin seguir una secuencia predecible.

Por ejemplo, en una clínica para tratamiento del cáncer de mama no se tiene manera de saber con
exactitud cuántas mujeres van a ser atendidas en un día cualquiera,de modo que el número de
mujeres del día siguiente es una variable aleatoria. Si los registros diarios de la clínica indican que
los valores de la variable aleatoria van desde 100 hasta 115 mujeres al día, entonces ésta es una
variable aleatoria discreta.

La Tabla 1 lista el número de veces que se ha alcanzado cada nivel durante los últimos 100 días.
Si los pasados 100 días es un comportamiento típico, es posible utilizar el registro para asignar
una probabilidad a cada número posible de mujeres y encontrar una distribución de probabilidad,
para ello se normalizan los datos ( se divide cada valor de la frecuencia entre 100, el número total
de días en que se tomaron los registros); la suma de todas las probabilidades calculadas deben
sumar 1.
Tabla 1 Número de mujeres examinadas durante 100 días

Para obtener el valor esperado de una variable aleatoria discreta, se multiplica cada valor que la
variable puede tomar por la probabilidad de ocurrencia de ese valor y luego se suman los
productos. La tabla 2 ilustra este procedimiento para el caso de la clínica. El total de la tabla indica
que el valor esperado de la variable aleatoria discreta “Número de mujeres examinadas al día” es
de 108.02 mujeres. Que significa que en un periodo largo, el número de mujeres examinadas
diariamente deberá tener un promedio de aproximadamente 108.02. Este valor no significa que
mañana 108.02 mujeres asistan a la clínica.

La directora de la clínica podría basar sus decisiones en el valor esperado del número de mujeres
examinadas diariamente debido a que éste es un promedio ponderado de los resultados que espera

en el futuro.
Tabla 2 Cálculo del valor esperado de la variable aleatoria discreta “Número de mujeres
examinadas al día".

3.1.1 Distribución de probabilidad de la Binomial; características y propiedades.

Esta distribución describe una variedad de procesos de interés para los administradores. Por otra
parte, describe datos discretos, no continuos, que son resultado de un experimento conocido como
proceso de Bernoulli.

Una distribución binomial o de Bernoulli tiene las siguientes características:

1. En cada prueba del experimento sólo son posibles dos resultados: éxito y fracaso.

2. La probabilidad de éxito es constante, es decir, que no varía de una prueba a otra. Se


representa por p.

3. La probabilidad de fracaso también es constante, Se representa por q, q = 1 − p

4. El resultado obtenido en cada prueba es independiente de los resultados obtenidos


anteriormente.

5. La variable aleatoria binomial, X, expresa el número de éxitos obtenidos en las n pruebas.


Por tanto, los valores que puede tomar X son: 0, 1, 2, 3, 4, ..., n.
La distribución bimomial se expresa por B(n, p), donde:

n es el número de pruebas.

k es el número de éxitos.

p es la probabilidad de éxito.

q es la probabilidad de fracaso.

Considerar que

Ejemplo:

Las posibilidades de obtener exactamente dos caras (en cualquier orden) en tres lanzamientos de
una moneda no alterada. Simbólicamente, se expresan los valores de la forma:

• p =probabilidad característica o probabilidad de tener éxito = 0.5

• q =1 - p = probabilidad de fracaso = 0.5

• r = número de éxitos deseados = 2

• n = número de intentos hechos = 3

Sustituyendo en la formula:

Ejemplo

La última novela de un autor ha tenido un gran éxito, hasta el punto de que el 80% de los lectores
ya la han leido. Un grupo de 4 amigos son aficionados a la lectura:

a) ¿Cuál es la probabilidad de que el grupo hayan leido la novela 2 personas?

n=4

p = 0.8

q = 0.2
b) ¿Y cómo máximo 2?
E jem pl o

Parámetros de la distribución binomial

Media

Varianza

Desviación típica

La probabilidad de que un artículo producido por una fabrica sea defectuoso es 0.02. Se envió un
cargamento de 10.000 artículos a unos almacenes. Hallar el número esperado de artículos
defectuosos, la varianza y la desviación típica.

3.1.2 Distribución de probabilidad Poisson; características, propiedades

La distribución de Poisson se utiliza para describir ciertos tipos de procesos, entre los que se
encuentran la distribución de llamadas telefónicas que llegan a un conmutador, las solicitudes de
pacientes que requieren servicio en una institución de salud, las llegadas de camiones y
automóviles a una caseta de cobro, y el número de accidentes registrados en cierta intersección.
Estos ejemplos tienen en común un elemento: pueden ser descritos mediante una variable aleatoria
discreta que toma valores enteros (0, 1, 2, 3, 4, 5, etc).

Características de los procesos que producen una distribución de probabilidad de Poisson

El número de vehículos que pasan por una sola caja de una caseta de cobro en una hora pico sirve

para ilustrar las características de la distribución de probabilidad de Poisson:


1. El promedio (la media) del número de vehículos que llegan por hora pico puede estimarse a
partir de datos sobre tráfico que se tengan disponibles.

2. Si se divide la hora pico en periodos (intervalos) de un segundo cada uno, se encuentra:

a. La probabilidad de que exactamente un vehículo llegue a una caja por segundo es muy
pequeña y es constante para cada intervalo de un segundo.

b. La probabilidad de que dos o más vehículos lleguen en un intervalo de un segundo es


tan pequeña que se le puede asignar un valor de cero.

c. El número de vehículos que llegan en un intervalo dado de un segundo es independiente


del momento en que dicho intervalo se presente en la hora pico.

d. El número de llegadas en cualquier intervalo de un segundo no depende del número de


llegadas en cualquier otro intervalo de un segundo.

Formula

Ejemplo

Suponga que se esta investigando la seguridad de una peligrosa intersección. Los registros
policiacos indican una media de cinco accidentes mensuales en esta intersección. El número de
accidentes está distribuido de acuerdo con una distribución de Poisson, y el Departamento de
Seguridad de Tránsito desea que se calcule la probabilidad de que en cualquier mes ocurran
exactamente 0, 1, 2, 3 o 4 accidentes. Podemos utilizar la Tabla 3 para evitar tener que calcular e
elevadas a potencias negativas. Aplicando la fórmula

Para que no haya accidentes:

Para que ocurra un accidente


Para que ocurran dos accidentes

Para que ocurran tres accidentes

Para que ocurran cuatro accidentes


Tabla 3 Valores de e para calcular probabilidades de Poisson

3.1.3 Distribución de Hipergeométrica; características propiedades

Es el modelo que se aplica en experimentos del tipo:

En una urna hay bolas de dos colores (blancas y negras), ¿cuál es la probabilidad de que
al sacar 2 bolas las dos sean blancas?

Son experimentos donde, al igual que en la distribución binomial, en cada ensayo hay tan sólo dos
posibles resultados: o sale blanca o no sale. Pero se diferencia de la distribución binomial en que
los distintos ensayos son dependientes entre sí:

Si en una urna con 5 bolas blancas y 3 negras en un primer ensayo saco una bola blanca,
en el segundo ensayo hay una bola blanca menos por lo que las probabilidades son diferentes
(hay dependencia entre los distintos ensayos).

Donde:

Donde:

N: es el número total de bolas en la urna

N1: es el número total de bolas blancas


N2: es el número total de bolas negras

k: es el número de bolas blancas cuya probabilidad se está calculando

n: es el número de ensayos que se realiza

Ejemplo

En una urna hay 7 bolas blancas y 5 negras. Se sacan 4 bolas ¿Cuál es la probabilidad de que 3
sean blancas?

N = 12; N1 = 7; N2 = 5; k = 3; n = 4

 Aplicando el modelo:

Por lo tanto, P (x = 3) = 0.3535. Es decir, la probabilidad de sacar 3 bolas blancas es del 35.3%.

3.2 Distribuciones de probabilidad para variables continuas

Este tipo de distribución se caracteriza por tener:

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene la forma de campana.

2. La media de una población distribuida normalmente cae en el centro de su curva normal.

3. Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la


distribución se encuentran también en el centro; en consecuencia, para una curva normal, la
media, la mediana y la moda tienen el mismo valor.

4. Las dos colas de la distribución normal de probabilidad se extienden indefinidamente y nunca


tocan el eje horizontal (desde luego, esto es imposible de mostrar de manera gráfica).
No importa cuáles sean los valores de μ y σ para una distribución de probabilidad normal, el área

total bajo la curva es 1.00, de manera que se puede pensar en áreas bajo la curva como si fueran
probabilidades. Matemáticamente es verdad que:

1. Aproximadamente el 68% de todos los valores de una población normalmente distribuida se


encuentra dentro de ± 1 desviación estándar de la media.

2. Aproximadamente el 95.5% de todos los valores de una población normalmente distribuida


se encuentra dentro de ± 2 desviaciones estándar de la media.

3. Aproximadamente el 99.7% de todos los valores de una población normalmente distribuida


se encuentra dentro de ± 3 desviaciones estándar de la media.

3.2.1 Distribución de probabilidad Normal características y propiedades.

En la Tabla 4 muestra el área bajo la curva normal entre la media y cualquier valor de la variable
aleatoria normalmente distribuida. Observar en la tabla la localización de la columna identificada
con z. El valor de z se deriva de la fórmula:

donde,
 x = valor de la variable aleatoria que nos preocupa.

 μ =media de la distribución de la variable aleatoria

 σ =desviación estándar de la distribución

 Z = número de desviaciones estándar que hay desde x a la media de la distribución

Tabla 4 Áreas bajo la curva de distribución de probabilidad normal estándar, entre la media y
valores positivos de z

Ejemplo

Se tiene un programa de entrenamiento diseñado para mejorar la calidad de las habilidades de los
supervisores de línea de producción. Debido a que el programa es autoadministrado, los
supervisores requieren un número diferente de horas para terminarlo. Un estudio de los
participantes anteriores indica que el tiempo medio para completar el programa es de 500 horas, y

que esta variable aleatoria normalmente distribuida tiene una desviación estándar de 100 horas.

a) ¿Cuál es la probabilidad de que un participante elegido al azar requiera más de 500 horas
para completar el programa?
Figura 2 Distribución del tiempo requerido para completar el programa de entrenamiento,
con el intervalo más de 500 horas sombreado

En la Figura 2, se observa que la mitad del área bajo la curva está localizada a ambos lados de la
media de 500 horas. Por tanto, se puede deducir que la probabilidad de que la variable aleatoria
tome un valor mayor a 500 es el área sombreada, es decir, 0.5.

b) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome entre 500 y 650 horas
para completar el programa de entrenamiento?

La probabilidad que responderá a esta pregunta está representada por el área con pantalla gris
entre la media (500 horas) y el valor x, en el cual estamos interesados (650 horas). El valor para z,
se calcula de la siguiente manera:
Al buscar z= 1.5 en la Tabla 4, se encuentra una probabilidad de 0.4332. En consecuencia, la
probabilidad de que un candidato escogido al azar requiera entre 500 y 650 horas para terminar el
programa de entrenamiento es ligeramente mayor a 0.4.

c) ¿Cuál es la probabilidad de que un candidato elegido al azar se tome más de 700 horas en
completar el programa?

Ahora interesa el área sombreada a la derecha del valor “700 horas”. Al utilizar la formula para el
calculo de Z, se obtiene:

Al buscar en la Tabla 4 un valor de z igual a 2.0, se encuentra una probabilidad de 0.4772. Esto
representa la probabilidad de que el programa tome entre 500 y 700 horas. Sin embargo, se desea
tener la probabilidad de que tome más de 700 horas. Puesto que la mitad derecha de la curva
(entre la media y la cola derecha) representa una probabilidad de 0.5, se puede obtener la respuesta
(el área que se encuentra a la derecha del punto correspondiente a 700 horas) si se resta 0.4772 de
0.5; 0.5000 - 0.4772 = 0.0228. Por tanto, hay un poco más de dos oportunidades en 100 de que un
participante elegido al azar se lleve más de 700 horas en completar el curso.

d) El director del programa de entrenamiento desea saber la probabilidad de que un participante


escogido al azar requiera entre 550 y 650 horas para completar el trabajo requerido en el
programa.
Esta probabilidad está representada por el área sombreada de la figura. Primero se calcula un valor
de z para punto de 650 horas de la siguiente manera:

El valor de z igual a 1.5 de la Tabla 4, se encuentra una probabilidad de 0.4332 (la probabilidad de
que la variable aleatoria esté entre la media y 650 horas). Ahora, para el segundo paso se calcula
un valor de z para el punto correspondiente a 550 horas, así:

De la Tabla 4 se obtiene que el valor z igual a 0.5 tiene una probabilidad de 0.1915 (la posibilidad
de que la variable aleatoria caiga entre la media y 550 horas). Para responder la pregunta, se debe
realizar la resta siguiente:

La probabilidad de que un candidato elegido al azar se tome entre 550 y 650 horas para completar
el programa de entrenamiento es un poco menor de 1 entre 4.

3.2.2 Distribución de probabilidad Ji- cuadrada; características y propiedades


Para estimar la varianza poblacional o la desviación estándar, se necesita conocer el estadístico
X2. Si se elige una muestra de tamaño n de una población normal con varianza σ 2, el estadístico:

Tiene una distribución muestral que es una distribución ji-cuadrada con gl=n-1 grados de libertad
y se denota X2 (X es la minúscula de la letra griega ji). El estadístico ji-cuadrada esta dado por:

donde n es el tamaño de la muestra, s2 la varianza muestral y σ2 la varianza de la población de


donde se extrajo la muestra. El estadístico ji-cuadrada también se puede dar con la siguiente
expresión:

Propiedades de las distribuciones ji-cuadrada

1. Los valores de X2 son mayores o iguales que 0.

2. La forma de una distribución X2 depende del gl=n-1. En consecuencia, hay un número


infinito de distribuciones X2 .

3. El área bajo una curva ji-cuadrada y sobre el eje horizontal es 1.

4. Las distribuciones X2 no son simétricas. Tienen colas estrechas que se extienden a la derecha;
esto es, están sesgadas a la derecha.

5. Cuando n>2, la media de una distribución X2 es n-1 y la varianza es 2(n-1).

6. El valor modal de una distribución X2 se da en el valor (n-3).

La siguiente figura ilustra tres distribuciones X 2. Notar que el valor modal aparece en el valor (n-
3) = (gl-2).

La función de densidad de la distribución X2 esta dada por:


para x>0

La tabla que se utilizará para estos apuntes es la del libro “ESTADÍSTICA PARA
ADMINISTRACIÓN Y ECONOMÍA”, Séptima edición de Levin, Richard I. Y Rubin, David S.,
la cual da valores críticos X2 u(gl) para veinte valores especiales de σ. Para denotar el valor crítico
de una distribución X2 con gl grados de libertad se usa el símbolo X 2 (gl); este valor crítico
determina a su derecha un área de σ bajo la curva X2 y sobre el eje horizontal. Por ejemplo para
encontrar X20.05 en la tabla se localiza 6 gl en el lado izquierdo y σ=0.05 a o largo del lado superior
de la misma tabla.

Cálculo de Probabilidad

El cálculo de probabilidad en una distribución muestral de varianzas sirve para saber como se va a
comportar la varianza o desviación estándar en una muestra que proviene de una distribución
normal.

Ejemplos

1. Suponga que los tiempos requeridos por un cierto autobús para alcanzar un de sus destinos en
una ciudad grande forman una distribución normal con una desviación estándar σ=1 minuto.
Si se elige al azar una muestra de 17 tiempos, encuentre la probabilidad de que la varianza
muestral sea mayor que 2.

Solución:
Primero se encontrará el valor de ji-cuadrada correspondiente a s2=2 como sigue:

El valor de 32 se busca adentro de la tabla en el renglón de 16 grados de libertad y se


encuentra que a este valor le corresponde un área a la derecha de 0.01. En consecuencia, el valor
de la probabilidad es P(s2>2)
2. Encuentre la probabilidad de que una muestra aleatoria de 25 observaciones, de una
población normal con varianza σ2=6, tenga una varianza muestral:

a) Mayor que 9.1

b) Entre 3.462 y 10.745

Solución.

a) Primero se procederá a calcular el valor de la ji-cuadrada:

Al buscar este número en el renglón de 24 grados de libertad da un área a la derecha de 0.05.


Por lo que la P(s2 >9.1) = 0.05

b) Se calcularán dos valores de ji-cuadrada:

Aquí se tienen que buscar los dos valores en el renglón de 24 grados de libertad. Al buscar el
valor de 13.846 se encuentra un área a la derecha de 0.95. El valor de 42.98 da un área a la
derecha de 0.01. Como se está pidiendo la probabilidad entre dos valores se resta el área de 0.95
menos 0.01 quedando 0.94.

Por lo tanto la P(3.462 ≤s2 ≤10.745) = 0.94


Estimación de la Varianza

Para poder estimar la varianza de una población normal se utilizará la distribución ji-cuadrada.

Al despejar esta fórmula la varianza poblacional:

Los valores de X2 dependerán de nivel de confianza que se quiera al cual se le llama 1- α.

Ejemplos:

1. Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de pasto distribuidas
por cierta compañía: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8, 46.9, 45.2 y 46. Encuentre un
intervalo de confianza de 95% para la varianza de todos los paquetes de semillas de pasto que
distribuye esta compañía, suponga una población normal.

Solución:

Primero se calcula la desviación estándar de la muestra:

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s2= 0.286.

Para obtener un intervalo de confianza de 95% se elige un α= 0.05. Después con el uso de la
tabla con 9 grados de libertad se obtienen los valores de X2.
Se puede observar en la gráfica anterior que el valor de X 2 corre en forma normal, esto es de
izquierda a derecha.

Por lo tanto, el intervalo de confianza de 95% para la varianza es:

Gráficamente:

Se observa que la varianza corre en sentido contrario, pero esto es sólo en la gráfica. Con un
nivel de confianza del 95% se sabe que la varianza de la población de los pesos de los paquetes de
semillas de pasto esta entre 0.135 y 0.935 decagramos al cuadrado.

2. En trabajo de laboratorio se desea llevar a cabo comprobaciones cuidadosas de la variabilidad


de los resultados que producen muestras estándar. En un estudio de la cantidad de calcio en el
agua potable, el cual se efectúa como parte del control de calidad, se analizó seis veces la
misma muestra en el laboratorio en intervalos aleatorios. Los seis resultados en partes por
millón fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26. Estimar la varianza de los resultados de la
población para este estándar, usando un nivel de confianza del 90%.
Solución:

Al calcular la varianza de la muestra se obtiene un valor de s2= 0.0285.

Se busca en la tabla los valores correspondientes con 5 grados de libertad, obteniéndose dos
resultados. Para X2(0.95,5)= 1.145 y para X2(0.0,5)= 11.07.

Entonces el intervalo de confianza esta dado por:

3.2.3 Distribución de aproximación de la normal a binomial; características y propiedades

Si X es una variable aleatoria binomial con media μ = np y varianza σ2 = npq, entonces la forma
limitante de la distribución de

conforme n → ∞, es la distribución normal estándar n(z; 0, 1). Donde la distribución normal se


calcula con μ = np y σ2 = np(1 – p). Para realizar estos ejercicios se utiliza la Tabla 5.
Tabla 5 Áreas bajo la curva de distribución de probabilidad normal estándar, entre la media y
valores positivos de z.

Ejemplo

Un paciente que padece una rara enfermedad de la sangre tiene 0.4 de probabilidad de recuperarse.
Si se sabe que 100 personas contrajeron esta enfermedad, ¿cuál es la probabilidad de que
sobrevivan menos de 30?

Solución

Se representa con la variable binomial X el número de pacientes que sobreviven. Como n = 100,
se debe de obtener resultados muy precisos usando la aproximación de la curva normal con
Para obtener la probabilidad que se desea, tenemos que calcular el área a la izquierda de x = 29.5.
El valor z que corresponde a 29.5 es

y la probabilidad de que menos de 30 de los 100 pacientes sobrevivan está dada por la región
sombreada en la Figura, por lo tanto,

Ejemplo

Un examen de opción múltiple tiene 200 preguntas, cada una con 4 respuestas posibles, de las que
sólo una es la correcta. ¿Cuál es la probabilidad de que solamente adivinando se obtengan de 25 a
30 respuestas correctas para 80 de los 200 problemas sobre los que el estudiante no tiene
conocimientos?

Solución

La probabilidad de adivinar una respuesta correcta para cada una de las 80 preguntas es p = 1/4. Si
X representa el número de respuestas correctas sólo porque se adivinaron, entonces,

Al usar la aproximación de la curva normal con


y

necesitamos el área entre x1 = 24.5 y x2 = 30.5. Los valores z correspondientes son

La probabilidad de adivinar correctamente de 25 a 30 preguntas es dada por la región sombreada


de la figura. En la Tabla 5 encontramos que

También podría gustarte