Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tema 10 Medidas de Dispersion Dra. Cala

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 8

TEMA.

10

MEDIDAS DE VARIABILIDAD O DISPERSIÓN

Las medidas de dispersión son esenciales en una distribución de datos,


complementando a las de posición central (Media Aritmética, Mediana y moda). Las
medidas de dispersión, pretenden resumir en un solo valor la dispersión que tiene un
conjunto de datos para caracterizar la variabilidad de los datos respecto a las mismas (
próximos entre sí o dispersos entre sí). Permiten entender cómo se alejan o acercan
los datos del promedio y la distribución dentro de los limites medidos. Su relevancia en
la formación estadística ha sido señalado por Wild y Pfannkuch (1999).

>Valor de Dispersión >Variabilidad


<Valor de Dispersión <Variabilidad
Siendo las más utilizadas: Rango, Varianza, Desviación Típica o Estándar.

1.-RANGO:

Una medida razonable de la variabilidad podría ser el Rango, que se obtiene restando el valor
máximo menos el valor mínimo.
R= Val max – Val min

Propiedades del Rango

Es fácil de calcular y sus unidades son las mismas que la de la variable.


No utiliza todas las observaciones (Solo dos de ellas)
El Rango aumenta con el número de observaciones, o bien se queda igual. En cualquier
caso, nunca disminuye.

Ejemplo

Calcular el Rango de la muestra de: 3,3,5,6,8.


2.-VARIANZA:

La varianza, es una medida de dispersión. Se define como la media aritmética de los cuadrados
de las desviaciones de los valores de la variable con respecto de la media de la distribución.
Otro aspecto a tener en cuenta es la dispersión de los datos entre sí.

∑(X-) 2
Debemos utilizar la siguiente formula: Ơ = _______
2

NOTA: Su problema son las unidades ya que minutos al cuadrado no existen, y si hablamos de
longitud m x m nos daría metros al cuadrado o sea superficie. El valor de la varianza no
lo podemos tomar, pues, como la cantidad que resulta, en las unidades que nos
proporcionan los datos. Para hacernos una idea aproximada, nunca exacta, hay que
obtener la raíz cuadrada, y así esta nueva medida, es la desviación típica:
Propiedades de la varianza:

1. Es siempre un valor no negativo, que pueda ser igual o distinta de 0. Sera 0 solamente
cuando Xi=.
2. La varianza es la medida de dispersión cuadrática óptima por ser la menor de todas.
3. Si a todos de los valores de la variable se le suma una constante, la varianza no se
modifica.
4. Si todos los valores de la variable se multiplican por una constante, la varianza queda
multiplicada por el cuadrado de dicha constante.
5. Si en una distribución una serie de subconjuntos, la varianza de la distribución inicial se
relaciona con la varianza de cada uno de los subconjuntos.

4.-DESVIACION ESTÁNDAR

Es una medida del grado de dispersión de los datos con respecto al valor promedio. Se define
como la Raíz cuadrada de la Varianza (Ơ2). Simbolizado con la letra griega Sigma “ Ơ ”. Expresa
la dispersión de la distribución y se expresa en las mismas unidades de medida de la variable.
La desviación estándar o Típica es la medida de dispersión más utilizada.

Debemos utilizar la siguiente


fórmula: Ơ = √Ơ2

A su vez la desviación típica, también tiene una serie


de propiedades que se deducen fácilmente de las de la varianza (ya que la desviación estándar
o típica es la raíz cuadrada de la varianza.
5.-USOS DE DESVIACIÓN ESTÁNDAR O TÍPICA

Mencionamos a continuación los usos de la desviación típica o estándar:

- Para determinar si un grupo de datos es más confiable que otro.


- Determina la encuesta más confiable.
- Mientras mas pequeña la desviación estándar sea, más confiables los resultados serán.
- La disminución de los valores de la Desviación Estandar indica menor variabialidad de
los datos.
- El incremento de los valores de la Desviación Estandar indica una mayor variablilidad
de los datos.

Ejemplo (DATOS NO AGRUPADOS)

Calcular la desviación estándar y varianza de las notas para una población de 6 alumnos. (datos
no agrupados) : 2,3,3,5,5,6

Xi ni (Xi-) (Xi-
)2
2 1 -2 4
3 2 -1 1
5 2 1 1
6 1 2 4
Total 6 10

PASO 1. CALCULAR EL PROMEDIO

∑Xi
Debemos utilizar la siguiente
formula:  = ____
Reemplazamos los datos:
n 2+3+3+5+5+6
 = ---------------------------
6
=4

PASO 2. CALCULAMOS LA VARIANZA

∑(X-) 2
Debemos utilizar la siguiente formula: Ơ 2 = _______
n
Reemplazamos los datos:

10
Ơ 2 = ---------
6
Ơ2 = 1,66
Ơ2 = 2

PASO 3. CALCULAR LA DESVIACIÓN ESTANDAR

Debemos utilizar la siguiente


fórmula: Ơ = √Ơ2

Reemplazamos datos

Ơ= √2
Ơ = 1,41

Ejemplo (DATOS AGRUPADOS CON INTERVALO)

Calcular la desviación estándar y varianza de la siguiente distribución de frecuencias. (datos


agrupados con intervalos)

EDAD X ni X . ni (X-)2 (X-)2 . ni  = 26


10 – 15 12,5 5 62,5 182,25 911,25
15 – 20 17,5 9 157,5 72,25 650,25
20-25 22,5 12 270 12,25 147
Ơ= 7
25- 30 27,5 15 412,5 2,25 33,75
Ơ 2= 54
30 – 35 32,5 11 357,5 42,25 4464,75
PASO 1. CALCULAR EL
35- 40 37,5 8 300 132,25 1058
PROMEDIO
TOTAL 60 1560 3265
∑X . ni
Debemos utilizar la siguiente
formula:  = ________

Reemplazamos los datos: n


1560
 = ___________
60

 = 26

PASO 2. CALCULAR LA VARIANZA


√∑(X-) . ni
Debemos utilizar la siguiente formula: Ơ 2=______________
n

Reemplazamos los datos:

3265
2
Ơ =---------
60

Ơ2 = 54,41
Ơ2 = 54

PASO 3. CALCULAR LA DESVIACIÓN ESTANDAR

Debemos utilizar la siguiente


fórmula: Ơ = √Ơ2

Reemplazamos datos

Ơ= √54

Ơ= 7,34
Ơ= 7

6.-CURVA NORMAL O DISTRIBUCIÓN NORMAL

La “Curva Normal” se denomina también “Curva en Campana, Campana de Gauss o


Distribución normal”. Es un modelo que corresponde a una ecuación matemática.

Es así mismo una descripción teórica e ideal en la que el Promedio Aritmético, Mediana y la
Moda tienen exactamente el mismo valor. La siguiente curva es Simétrica respecto a la media.
Es decir que existen personas que miden menos que 169 mts y personas que miden mas de
169 mts. En cantidades similares.

Las medidas de dispersión nos permiten identificar la forma en que se separan o aglomeran los
valores de acuerdo a su representación gráfica. Estas medidas describen la manera como los
datos tienden a reunirse de acuerdo con la frecuencia con que se hallen dentro la información.
Sus principales medidas son la Asimetría y la Curtosis.

6.1 ASIMETRIA

Esta medida nos permite identificar si los datos se distribuyen de forma uniforme alrededor
del punto central ( Media aritmética ). La asimetría presenta tres estados diferentes, cada uno
de los cuales define de forma concisa como están distribuidos los datos respecto al eje de
asimetría.

Se dice que una Asimetría es positiva cuando la mayoría de los datos se encuentran por
encima del valor de la media aritmética, la curva es Simétrica cuando se distribuyen
aproximadamente la misma cantidad de valores en ambos lados de la media y se conoce como
Asimetría negativa cuando la mayor cantidad de datos se aglomeran en los valores menores
que la media.

6.2. CURTOSIS

Esta medida determina el grado de concentración que presentan los valores en la región
central de la distribución. Por medio del Coeficiente de Curtosis, podremos identificar si existe
una gran concentración de valores (Leptocúrtica), una concentración normal (Mesocútica) ó
una baja concentración (Platicúrtica).
7.-COMO SE USA LA TABLA DE LA CURVA NORMAL.

Supongamos un conjunto de personas con edad promedio de 25 años y desviación estándar


3,86. Nuestro valor de interés (x) es 30 años. El valor de Z correspondiente será:

(X – Promedio)
Z= ___________________
Desviación Estándar

( 30 – 25)
Z= _____________= 1.29
3,86
Este Valor de Z indica que la edad de 30 años está a 1.29 desviaciones estándar sobre el
promedio. Ahora bien, la tabla de la distribución normal, entrega valores de probabilidad para
los distintos valores de Z.

¿Cómo se usa la tabla de Z?


Lo averiguaremos con un valor concreto; ¿Cuál es la probabilidad de encontrar un valor de z
menor o igual a 1?96?
Vamos a la tabla y familiaricémonos con algunas de sus características.

- En la primera columna de la tabla aparece el entero y primer decimal del valor de Z,


vemos que los valores van desde -3.4 a 3-3. En la primera fila (arriba), aparece el
segundo decimal del valor de Z y , como es lógico, hay 10 números ( 0,00 a 0,09).
- Entonces, para nuestro valor de Z = 1,96 buscaremos 1,9 en la primera columna de la
tabla y 0,06 en la primera fila de la tabla. Trazaremos líneas perpendiculares desde
estos valores y llegaremos a un número en el cuerpo de la tabla (véase la tabla mas
abajo , que tienen marcadas las dos perpendiculares de las que hablamos. El numero
que encontramos y que esta destacado es: 0,9750.
- Por lo tanto, la probabilidad asociada a Z= 1,96 es 0,9750, es decir que la probabilidad
de encontrar un valor de Z menor o igual a 1,96 es 0,9750.
En nuestro ejemplo anterior, con la edad 30 años, vemos que el valor Z=1,29 tiene u a
probabilidad asociada de 0,9014. Entonces, la probabilidad de encontrar una persona con edad
de 30 años o menos, en ese grupo humano, es 0,9014.
TABLA DE DISTRIBUCIÓN NORMAL

También podría gustarte