PROBABILIDAD
PROBABILIDAD
PROBABILIDAD
Desviacin estndar
La desviacin estndar () mide cunto se separan los datos. La frmula es fcil: es la raz cuadrada de la varianza. As que, "qu es la varianza?"
Varianza
la varianza (que es el cuadrado de la desviacin estndar: 2) se define as: Es la media de las diferencias con la media elevadas al cuadrado. En otras palabras, sigue estos pasos: 1. Calcula la media (el promedio de los nmeros) 2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado). 3. Ahora calcula la media de esas diferencias al cuadrado. (Por qu al cuadrado?)
Ejemplo
T y tus amigos habis medido las alturas de vuestros perros (en milmetros):
Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm. Calcula la media, la varianza y la desviacin estndar.
Respuesta:
600 + 470 + 170 + 430 + 300 Media = 5 = 5 1970 = 394
Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media: 2062 + 762 + (-224)2 + 362 + (-94)2 Varianza: = 5 As que la varianza es 21,704. Y la desviacin estndar es la raz de la varianza, as que: Desviacin estndar: = 21,704 = 147
2
108,520 = 5 = 21,704
y lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas estn a distancia menos de la desviacin estndar (147mm) de la media:
As que usando la desviacin estndar tenemos una manera "estndar" de saber qu es normal, o extra grande o extra pequeo. Los Rottweilers son perros grandes. Y los Dachsunds son un poco menudos... pero que no se enteren!
La Distribucin Normal La Distribucin Normal es la ms importante de todas y la ms usada en ciencias sociales; es una distribucin continua, no discreta. La Distribucin Normal tiene caractersticas tiles a muchas situaciones en las que es preciso decidir, tomando como base las muestras que se levantan de una poblacin dada. Representa muy bien las distribuciones de fenmenos reales, incluyendo caractersticas humanas, tales como el peso, la altura, el coeficiente de inteligencia y otras. Campana de Gauss , es una representacin grfica de la distribucin normal de un grupo de datos. stos se reparten en valores bajos, medios y altos, creando un grfico de forma acampanada y simtrica con respecto a un determinado parmetro. Se conoce como curva o campana de Gauss o distribucin Normal. La campana de Gauss est definida por la funcin:
Propiedades de la distribucin normal: La distribucin normal posee ciertas propiedades importantes que conviene destacar: 1. Tiene una nica moda, que coincide con su media y su mediana. 2. La curva normal es asinttica al eje de abscisas. Por ello, cualquier valor entre y es tericamente posible. El rea total bajo la curva es, por tanto, igual a 1. 3. Es simtrica con respecto a su media . Segn esto, para este tipo de variables existe una probabilidad de un 50% de observar un dato mayor que la media, y un 50% de observar un dato menor. 4. La distancia entre la lnea trazada en la media y el punto de inflexin de la curva es igual a una desviacin tpica ( ). Cuanto mayor sea , ms aplanada ser la curva de la densidad. 5. El rea bajo la curva comprendido entre los valores situados aproximadamente a dos desviaciones estndar de la media es igual a 0.95. En concreto, existe un 95% de posibilidades de observar un valor comprendido en el intervalo . 6. La forma de la campana de Gauss depende de los parmetros y . La media indica la posicin de la campana, de modo que para diferentes valores de la grfica es desplazada a lo largo del eje horizontal. Por otra parte, la desviacin estndar determina el grado de apuntamiento de la curva. Cuanto mayor sea el valor de , ms se dispersarn los datos en torno a la media y la curva ser ms plana. Un valor pequeo de este parmetro indica, por tanto, una gran probabilidad de obtener datos cercanos al valor medio de la distribucin.
Ejercicio 1 Est en proceso un curso completo de Estadstica. Cul es la probabilidad de que un participante elegido al azar se tome entre 500 y 650 horas para completarlo, dado que el tiempo promedio de aprendizaje es de 500 horas y se conoce que la desviacin estndar es de 100 horas? Lo primero que anotamos son los estadsticos: La media = 500 y la desviacin estndar, = 100 La pregunta nos pide la probabilidad de que un alumno tome entre 500 y 650 horas para cubrir el curso; la probabilidad es P(500 a 650) Asumimos que la distribucin de las horas de aprendizaje es normal, graficamos nuestra Curva de Distribucin Normal. Grfica 5.9
Para resolver el problema debemos estandarizar los datos con nuestra frmula: z = (x )/; z = (650 500)/100; 1.5 Convertimos la informacin en desviaciones estndar, lo que nos dice que la cantidad de horas = 650 est ubicada a una distancia de z = 1.5 desviaciones estndar de la media Recurrimos a la Tabla de Distribucin Normal y buscamos en la columna de las z = 1.5 Como no hay ms decimales, encontramos el valor que buscamos en la columna inmediata a su derecha (0.00) que es igual a 0.4332 sa es la probabilidad de que un participante elegido al azar emplee de 500 a 650 horas para terminar el curso es 0.4332. Ejercicio 2
Con los mismos datos del anterior problema Cul es la probabilidad de que un participante, elegido al azar, se tome ms de 700 horas en completar el programa? Tomamos nota de los estadsticos dados x = ms de 700 horas; = 500; = 100 Diseamos una curva normal; en ella debemos encontrar la P(ms de 700) Grfica 5.10
Lo que nos piden es encontrar la probabilidad a la derecha de 700 horas. Sabemos que = 500; x = ms de 700; = 100 Convertimos nuestros datos en desviaciones estndar; z = (700 500)/100 =2 Este dato nos dice que 700 horas est a 2 desviaciones estndar de la media que es 500. En la tabla encontramos que para 2 desviaciones estndar, la probabilidad es 0.4772. Pero el problema no se refiere a 700 horas, sino a ms de 700 horas Es decir, no se refiere a la probabilidad que se encuentra entre 500 y 700, sino que se encuentra en ms de 700 horas. En la grfica 5.10 nos indica que lo que buscamos es la probabilidad a la derecha de 700. Sabemos que la mitad derecha, como la izquierda, tiene una probabilidad de 0.5 Sabemos que la probabilidad de 700 horas = 0.4772, realizamos la siguiente operacin: Valor total de la mitad derecha de la curva = 0.5, menos la probabilidad de 700 = 0.4772 As: 0.5000 0.4772 = 0.0228 es la P(ms de 700 horas.)
Ejercicio 3 Con los mismos datos del problema original, se desea saber la probabilidad que a un participante le tome entre 550 y 650 horas aprender el curso total. Para empezar, nos damos cuenta de que es preciso calcular el valor de dos x; x1 y x2 Los datos son = 500; x1 = 550; x2 = 650; = 100 Primero calculamos el valor de cada x De inmediato notamos que el valor de 550 est a la derecha de la media = 500 Empezamos calculando el nmero de desviaciones estndar entre 550 y 500 z = (x )/= (550-500)/100 = 0.5 Buscamos en la tabla el valor de 0.5 en la columna de las desviaciones estndar (z) Ese valor es 0.1915; ahora hacemos lo mismo con el clculo tomando como x = 650. z= (650 500)/100 = 1.5 El valor para 1.5 desviaciones estndar en la tabla es 0.4332. El problema consiste en hallar la probabilidad entre 550 y 650 horas Esto representa hallar el rea entre 550 y 650, tal como se ve en la siguiente curva, recordando que la media es 500 Para encontrar el valor que nos pide el problema, que es entre 550 y 650 horas, tomamos el rea entre 650 y 500 y le restamos el rea entre 550 y 500. Es decir, toamos el rea A+B y le restamos el rea A Lo que queda es el rea B, que es el rea que estamos buscando Grfica 5.11
La probabilidad de que un participante necesite un tiempo entre 550 y 650 horas para vencer el curso completo de Estadstica, es 0.2417 Ejercicio 4 Cul es la probabilidad de que un participante escogido al azar se tome entre 420 y 570 horas para aprobar el curso? Diseamos nuestra curva normal con las condiciones requeridas: El problema nos pide la suma de las probabilidades que se encuentran entre 420 y 500 ms la que est entre 570 y 500; necesitamos reas de las dos mitades de la curva. Es decir, sumar las reas A + B Empezaremos calculando los valores de sus respectivas desviaciones estndar = z. z1 = (420-500)/100 = -0.80; z2 = (570 500)/100 = 0.70
Las desviaciones estndar son -0.80 y 0.70 respectivamente; no tomamos en cuenta el signo negativo y ms bien buscamos las probabilidades respectivas a cada z en la tabla.
Las probabilidades son, respectivamente 0.2881 y 0.2580; sumamos estas probabilidades: 0.2881 + 0.2580 = 0.5461.
La probabilidad de que un participante escogido al azar requiera entre 420 y 570 horas para aprender el curso de estadstica es 0.5461. Ejercicio 5 Cul es la probabilidad de que a un participante le toma ms de 500 horas? El problema nos dice que el alumno puede tomar cualquier nmero de horas despus de la media aritmtica que, como hemos venido usando en todos los ejemplos, es de 500. Ya es fcil para nosotros deducir que lo que nos estn pidiendo es la probabilidad total de la segunda mitad de la curva normal, esto es: 0.5000 Esa es tambin la probabilidad de que el participante le tome ms de 500 horas.