Distribucion Normal
Distribucion Normal
Distribucion Normal
CAPTULO 16
DISTRIBUCIN NORMAL
Cuando los datos estn distribuidos con frecuencias ascendentes-descendentes aproximadamente simtricas, se le llama distribucin normal. Cuando se trata de una variable discreta, o sea que solamente puede tomar valores como 1, 2, 3, 4, etc., pero no 2.04 5.6, el histograma correspondiente est formado por un conjunto de barras como se muestra en la figura 16.1 a). Si, en cambio, la variable es continua, el histograma es una curva como la mostrada en la figura 16.1 b), llamada curva normal.
figura 16.1
185
Distribucin normal
En una curva normal lo que se utiliza es el rea bajo la curva entre dos valores x1 y x 2 , ver figura 16.1b, cuyo valor se emplea para obtener diferentes informaciones de los datos que conforman dicha curva. El procedimiento para obtener esa rea es la que se va a estudiar en este tema. Adems, en una curva normal las tres medidas de tendencia central coinciden en el centro: la media, la moda la mediana; si acaso, puede haber una escasa diferencia entre algunas de ellas. Tambin es simtrica respecto de la media, que es el punto ms elevado de la curva y, por lo tanto, el rea bajo la curva hacia la izquierda de la media es del 50% y el otro 50% se localiza a la derecha. Ver figura 16.2. Una caracterstica muy importante de la curva normal es que a partir de su eje de simetra se puede dividir como lo muestra la figura 16.3, de tal manera que el valor igual a cero de la grfica corresponda siempre a la media aritmtica de la distribucin normal de datos, y luego los datos nominales se pueden transformar a uno equivalente de la escala de 3 a + 3 de la figura 16.3. Por eso, a los datos comprendidos en la escala de - 3 a + 3 se les llama dato estndar.
figura 16.3
figura 16.2
En esa escala estandarizada, el 1 representa una desviacin estndar, el 2 representa dos desviaciones estndares, y as sucesivamente. El signo positivo solamente indica que est a la derecha del cero y el signo negativo significa que est a la izquierda. Con los ejemplos venideros se aclararn esos significados.
186
Distribucin normal
16.1 ESTANDARIZACIN DE DATOS Por lo dicho en el prrafo anterior, los datos pertenecientes a una distribucin normal se pueden estandarizar o normalizar, lo cual se consigue utilizando la frmula
z=
en donde:
xx s
z x x s
= = = =
dato estandarizado o normalizado valor nominal del dato a estandarizar media aritmtica del conjunto de datos desviacin estndar.
x 6 7 8 9 10 11 12 13 14 15 16 17 18
f 1 2 3 5 9 15 18 15 9 5 3 2 1 88
Ejemplo 1: Convertir cada uno de los datos nominales de la siguiente tabla a datos estandarizados. Solucin: Para transformar un dato nominal en dato estndar, tambin llamado dato z, se requiere calcular la media de todo el conjunto. Para este caso ya se da por hecho que se sabe calcular la media y la desviacin estndar, por lo que se omiten sus clculos. La media es x = 12 y la desviacin estndar es s = 2.2994 . Se tienen ya todos los datos para utilizar la frmula del dato z:
xx z= . s
187
Distribucin normal
dato nominal x 6 7 8 9 10 11 12 13 14 15 16 17 18
sustituyendo
z= 6 12 2.2994 7 12 2.2994 8 12 2.2994 9 12 2.2994 10 12 2.2994 11 12 2.2994 12 12 2.2994 13 12 2.2994 14 12 2.2994 15 12 2.2994 16 12 2.2994
dato z z = - 2.6093 z = - 2.1744 z = - 1.7395 z = - 1.3046 z = - 0.8697 z = - 0.4348 0 z = 0.4348 z = 0.8697 z = 1.3046 z = 1.7395 z = 2.1744 z = 2. 6093
z=
z=
z=
z=
z=
z=
z=
z=
z=
z=
z=
17 12 2.2994 18 12 2.2994
z=
188
Distribucin normal
El significado, a partir de que la media aritmtica del conjunto es x = 12 y la desviacin estndar es s = 2.2994 , es el siguiente: Un valor estandarizado z = 1 significa una distancia a partir de la media aritmtica igual a una desviacin estndar a la derecha, es decir una distancia de 2.2994. Un valor estandarizado z = 2 significa una distancia a partir de la media aritmtica igual a dos desviaciones estndar a la izquierda, es decir, una distancia de 4.5988. Ahora bien, si al dato nominal x = 6 le corresponde un dato estndar z = - 2.609, significa que ese 6 se alej de la media 2.609 desviaciones estndares a la izquierda. Y as con cada uno de los datos nominales. Grficamente:
figura 16.4
189
Distribucin normal
C U E S T I O N A R I O 15 1) Convertir a datos estndar o dato z cada uno de los datos nominales de las siguientes tablas con distribucin normal:
a)
x 4 5 6 7 8 9 10 x 14 15 16 17 18 19 20 x 40 45 50 55 60 65 70
b)
x 9 11 13 15 17 19 21 x 2 4 6 8 10 12 14 x 39 40 41 42 43 44 45
c)
d)
e)
f)
190
Distribucin normal
16.2 AREAS BAJO LA CURVA NORMAL En una curva normal, el rea bajo la curva desde el extremo izquierdo hasta la media, es decir, hasta el eje de simetra, es del 50% y, obviamente, el otro 50% est en la parte derecha. Una caracterstica importante de la curva normal y de los datos normalizados es que el rea bajo la curva desde la media hasta una desviacin estndar, es decir desde z = 0 hasta z = 1, ya sea a la izquierda o a la derecha, siempre es del 34.13% respecto del rea total que puede haber bajo la curva. Ver parte superior de la figura 16.5. De la misma forma, el rea bajo la curva desde la media hasta dos desviaciones estndar, es decir desde z = 0 hasta z = 2 , ya sea a la izquierda o a la derecha, es del 47.72%. Ver parte inferior de la figura 16.5.
figura 16.5
191
Distribucin normal
Como la curva normal sale de graficar los datos recolectados, es obvio que esos porcentajes de reas bajo la curva tambin lo son para dichos datos, es decir, para una desviacin estndar, el porcentaje de datos entre la media y z = 1 es de 34.13% aproximadamente; para dos desviaciones estndar el porcentaje de datos entre la media y z = 2 es tambin aproximadamente de 47.72%. Por lo tanto, es posible obtener el porcentaje de rea bajo la curva entre la media y cualquier valor estandarizado z, lo cual se ha concentrado en una tabla. La tabla de la siguiente pgina expresa el porcentaje de rea desde la media hasta cada correspondiente valor z. Esto ltimo es muy importante: Debe tomarse en cuenta que los valores mostrados en la tabla son siempre desde la media hasta el valor estandarizado z. Ejemplo 1: Al recolectar 250 datos, se obtuvo que la media es x = 7.65 y la desviacin estndar s = 2.24 . Calcular el nmero de datos aproximados que hay entre la media y el dato nominal x = 8.1 . Solucin: En este caso el enunciado proporciona los valores de la media y de la desviacin estndar, por lo que los incisos a) y b) del proceso quedan sin efecto. Entonces, continuando con el inciso c), hay que convertir a dato z el valor nominal x = 8.1 . con la frmula dada en la pgina 185, o sea:
z= z=
xx s
Se toman solamente dos decimales porque as vienen en las tablas. A continuacin, conforme a lo establecido en el inciso d) se busca en las tablas (ver pgina siguiente) el valor de z = 0.20 , para lo cual se localiza en la columna z de la izquierda el valor 0.2 y en la primera fila de la tabla el 0. La celda interseccin de lo anterior es el valor buscado para z = 0.20 .
192
Distribucin normal
193
Distribucin normal
El valor que le corresponde de 7.93% es el porcentaje de rea bajo la curva entre la media y el dato z = 0.20 , pero como ese porcentaje tambin corresponde a los datos recolectados, entonces puede obtenerse por una simple regla de tres el nmero de datos nominales comprendidos en esa regin:
figura 16.6
nd =
nd = 19.82
El nmero datos en forma calculada es nd = 19.82, pero ese valor carece de sentido ya que los datos recolectados siempre son nmeros enteros, porque se recolectan 200 datos, o 220 datos, o 300 datos, pero jams 291.8. Entonces entre la media aritmtica y el dato z = 0.20 no pueden haber 19.82 datos nominales, o hay 19 o hay 20, pero no una fraccin de ellos. De manera que lo correcto es redondear y expresarlo no como que es igual, sino como aproximadamente. La solucin entonces se expresa as: Hay aproximadamente 20 datos entre la media x = 7.65 y el dato nominal x = 8.1 .
194
Distribucin normal
Ejemplo 2: Al recolectar 850 datos con una distribucin normal, se obtuvo una media de x = 27 y una desviacin estndar s = 5.34 . Calcular el nmero de datos aproximados que hay entre la media y el dato nominal x = 20 . Solucin: En este caso el enunciado proporciona los valores de la media y de la desviacin estndar, por lo que los incisos a) y b) del proceso quedan sin efecto. Entonces, continuando con el inciso c), hay que convertir a dato z el valor nominal x = 20, con la frmula:
z= z=
xx s
20 27 = 1.31 5.34
En este caso el valor de z es negativo, lo que significa que el dato nominal x = 20 est a la izquierda de la media aritmtica, pero en las tablas se busca simplemente como z = 1.31 ; le corresponde un porcentaje de rea de 40.49%. Ver figura 16.7.
figura 16.7
Entonces puede obtenerse por una simple regla de tres el nmero aproximado de datos nominales comprendidos en esa regin:
195
Distribucin normal
nd =
nd = 344.16
El nmero datos en forma calculada es nd = 344.16, pero ese valor carece de sentido ya que los datos recolectados, como se explic en el ejemplo anterior, siempre son nmeros enteros. De tal manera que entre la media aritmtica y el dato z = 1.31 no pueden haber 344.16 datos nominales, o hay 344 o hay 345 aproximadamente, pero no una fraccin de ellos. De manera que lo correcto es redondear y expresarlo no como que es igual, sino como aproximadamente. La solucin entonces se expresa as: Hay aproximadamente 344 datos entre la media x = 27 y el dato nominal x = 20 .
16.3 PORCENTAJE ENTRE DOS DATOS NOMINALES Otra problema que puede presentarse es cmo obtener el porcentaje de rea bajo la curva ya no a partir de la media, sino entre dos datos nominales. Hay dos opciones: La primera es que los datos estandarizados z1 y z 2 se localicen uno a la izquierda y el otro a la derecha de la media. La solucin a ste nuevo problema es muy simple, pues por una lgica muy elemental se puede deducir que el rea total es igual a la suma del rea 1 ms el rea 2, como se ve en la figura 16.8, en donde A1 es el rea desde la media hasta el dato estanda-
196
Distribucin normal
rizado z1 , la que se obtiene en tablas siguiendo el mismo procedimiento del apartado anterior, A2 es el rea desde la media hasta el dato estandarizado z 2 .
figura 16.8
Otra opcin que puede presentarse es la que se muestra en la figura 16.9, consistente en que ambos valores estandarizados z1 y z 2 se encuentren del mismo lado respecto de la media, en la que tambin por una lgica muy elemental puede deducirse que el rea total es simplemente la resta del rea 1 menos el rea 2, ver figura 16.9, en donde A1 es el rea desde la media hasta el dato estandarizado z1 , la que se obtiene en tablas siguiendo el mismo procedimiento del apartado anterior; A2 es el rea desde la media hasta el dato estandarizado z 2 . De tal manera que el porcentaje de datos entre z1 y z2 es la resta de porcentajes bajo la curva de cada uno.
figura 5.9
Ejemplo 3: De un conjunto de datos con una distribucin normal, se obtuvo una media de x = 33.2 y una desviacin estndar s = 9.4. Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 14 y el dato nominal x 2 = 45 . Solucin: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de rea bajo la curva que a cada uno le corresponde se obtiene que
197
Distribucin normal
z1 = z1 =
z2 = z2 =
xx s 45 33.2 = 1.25 9 .4
A1 = 47.93%
A2 = 39.44%
Como z1 es negativo significa que su regin o porcentaje de rea est a la izquierda de la media y como z2 es positivo, su porcentaje de rea est a la derecha de la media. Por lo tanto, el porcentaje total de rea bajo la curva es la suma de ambas, como se muestra en la figura 16.10:
figura 16.10
198
Distribucin normal
Ejemplo 4: De un conjunto de datos con una distribucin normal, se obtuvo una media de x = 43.2 y una desviacin estndar s = 8.9 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 53 y el dato nominal x 2 = 68 . Solucin: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de rea bajo la curva que a cada uno le corresponde se obtiene que
z1 = z1 =
xx s 53 43.2 = 1.10 8 .9
z2 = z2 =
xx s 68 43.2 = 2.78 8 .9
A1 = 36.43%
A2 = 49.73%
El porcentaje total de rea bajo la curva es la resta de ambas (ver la figura 16.11):
figura 16.11
199
Distribucin normal
Ejemplo 5: De un conjunto de datos con una distribucin normal, se obtuvo una media de x = 20.4 y una desviacin estndar s = 8.9 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 5 y el dato nominal x 2 = 25 . Solucin: Estandarizando ambos datos nominales y localizando en las tablas el porcentaje de rea bajo la curva que a cada uno le corresponde se obtiene que
z1 =
z2 =
25 20.4 = 1.84 2 .5
A1 = 50%
A2 = 46.71%
En este caso el porcentaje de rea bajo la curva para z1 = 6.16 es del 50% porque en las tablas a partir de z = 3.99 ya est abarcada toda la mitad, o sea ya le corresponde el 50% de rea bajo la curva. Significa que de z = 3.99 en adelante est considerada ya toda la mitad de la curva. En casos como el de este ejemplo debe interpretarse que el dato nominal x1 = 5 no existe, lo que no impide que se proponga en el enunciado. Es el equivalente a que se preguntara: cuntos alumnos de la preparatoria tienen menos de 185 aos de edad? Una cosa es que nadie tenga 185 aos y otra cosa es que todos los alumnos de la preparatoria tengan menos de 185 aos de edad. El 100% de los estudiantes estn por debajo de 185 aos, aunque no existe el dato de 1 persona con 185 aos. Entonces el porcentaje total de rea bajo la curva es la suma de ambas por estar a ambos lados de la media, como se muestra en la figura 16.12:
figura 16.12
200
Distribucin normal
Ejemplo 6: De un conjunto de datos con una distribucin normal, se obtuvo una media de x = 33 y una desviacin estndar s = 4.5 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x = 38 y el dato nominal ms grande. Solucin: Estandarizando el dato nominal x = 38 :
z1 =
38 33 = 1.11 4.5
que le corresponde un porcentaje de rea desde la media de A1 = 36.65 %, mientras que al dato nominal ms grande le corresponde A2 = 50% de rea bajo la curva a partir de la media. Por lo tanto, el porcentaje de rea pedido es la resta:
figura 16.13
201
Distribucin normal
C U E S T I O N A R I O 16
1)
Al recolectar 450 datos con una distribucin normal se obtuvo una media de x = 50 y una desviacin estndar s = 17.4 . Calcular el nmero de datos aproximados que hay entre el dato nominal x1 = 34 y el dato nominal x 2 = 62 .
2)
Al recolectar 270 datos con una distribucin normal se obtuvo una media de x = 400 y una desviacin estndar s = 14 . Calcular el nmero de datos aproximados que hay entre el dato nominal x1 = 387 y el dato nominal x 2 = 430 .
3)
Al recolectar 500 datos con una distribucin normal se obtuvo una media de x = 225 y una desviacin estndar s = 12 . Calcular el nmero de datos aproximados que hay entre el dato nominal x1 = 203 y el dato nominal x 2 = 221 .
4)
Al recolectar 940 datos con una distribucin normal se obtuvo una media de x = 120 y una desviacin estndar s = 16 . Calcular el nmero de datos aproximados que hay entre el dato nominal x1 = 128 y el dato nominal x 2 = 160 .OJO
5)
Al recolectar 873 datos con una distribucin normal se obtuvo una media de x = 220.1 y una desviacin estndar s = 15 . Calcular el nmero de datos aproximados que hay entre el dato nominal x1 = 229 y el dato nominal x 2 = 296.6 .
6)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 99 y una desviacin estndar s = 5.42 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 71.9 y el dato nominal x 2 = 96 .
202
Distribucin normal
7)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 809 y una desviacin estndar s = 21.8 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 787.2 y el dato nominal x 2 = 809 .
8)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 120 y una desviacin estndar s = 19 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 120 y el dato nominal x 2 = 253 .
9)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 252 y una desviacin estndar s = 31.9 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 41.2 y el dato nominal x 2 = 475 .
10)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 109.6 y una desviacin estndar s = 10.2 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 125 y el dato nominal x 2 = 154 .
11)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 33 y una desviacin estndar s = 8.5 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 25 y el dato nominal ms grande.
12)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 33 y una desviacin estndar s = 8.5 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 25 y el dato nominal ms chico.
13)
De un conjunto de datos con una distribucin normal se obtuvo una media de x = 55.5 y una desviacin estndar s = 2.5 . Calcular el porcentaje de rea bajo la curva que hay entre el dato nominal x1 = 25 y el dato nominal x 2 = 80 .
203
Distribucin normal
14)
El rea bajo la curva desde el dato nominal x1 = 10 hasta otro dato nominal x 2 es del 40.15% dentro de un conjunto de datos con una distribucin normal cuya media es de x = 39 y su desviacin estndar de s = 14.5 . Calcular el valor del dato nominal x 2 .
15)
El rea bajo la curva desde el dato nominal x1 = 10 hasta otro dato nominal x 2 es del 80.15% dentro de un conjunto de datos con una distribucin normal cuya media es de x = 39 y su desviacin estndar de s = 14.5 . Calcular el valor del dato nominal x 2 .
16)
El rea bajo la curva desde el dato nominal ms pequeo hasta otro dato nominal x 2 es del 33% dentro de un conjunto de datos con una distribucin normal cuya media es de x = 39 y su desviacin estndar de s = 14.5 . Calcular el valor del dato nominal x 2 .
17)
El rea bajo la curva desde el dato nominal ms pequeo hasta otro dato nominal x 2 es del 93.7% dentro de un conjunto de datos con una distribucin normal cuya media es de x = 39 y su desviacin estndar de s = 14.5 . Calcular el valor del dato nominal x 2 .
204