Medidas de Dispersión

MEDIDAS DE DISPERSIÓN
(Guía de clase)
A. Una pregunta muy particular que se puede hacer a una
FICHA Nº 18
distribución de datos es de qué magnitud es
es la heterogeneidad que se observa.
O Las medidas de dispersión generalmente acompañan a las

medidas de tendencia central por una razón básica: la media aritmética
informa sobre cuál es el centro de gravedad pero qué tan homogénea es
la distribución.
O Conceptualmente, la pregunta por una estimación de la heterogeneidad

está en la base de los estudios de desigualdad en la distribución del
ingreso, de bienes culturales, del acceso a servicios sociales.
O La comparación de las medidas de desigualdad entre dos colectivos (por

ejemplo, desigualdad de aprendizajes entre escuelas; ingresos entre
países; de ingresos entre años distintos) constituye un enfoque problema
de investigación que se pregunta en qué difieren dos casos de interés.
O Por lo general, las medidas de dispersión se utilizan conjuntamente con

las medidas de tendencia central. De hecho, en algunas de las fórmulas
para su cálculo se emplea directamente la media aritmética como
referencia de dispersión.
O La diferencia entre las medidas obedece a una pregunta: ¿mayor o
EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
(Guía de clase)
menor dispersión respecto de qué?.
S Las medidas que se han ido desarrollando constituyen sofisticaciones

matemáticas a las sucesivas respuestas dadas a esta pregunta.
S Por principio, las medidas de dispersión ubican su referente de dispersión en

la propia distribución observada de los datos y no en relación de un parámetro
ideal o deseable. Este no es el caso en todas las medidas de desigualdad. En
el caso del índice de Gini para medir concentración y desigualdad, su
referente es ideal: una distribución completamente democrática.
B. Las medidas de dispersión más frecuentemente utilizadas son el

rango, la varianza y el desvío estándar.
O Una medida simple que se podría proponer para analizar la dispersión

es el rango. Éste se define la distancia entre el valor mínimo y el
máximo observados.
S Esta medida permitiría observar qué tan amplia es la distribución. Una medida
importante por ejemplo, cuando se comparan tamaños de hogares en
distintos países o regiones de América Latina.
S Tiene un inconveniente importante: el rango puede tomar valores máximos y

mínimos que son atípicos (con una frecuencia simple de 1, por ejemplo) o
muy desviados o “out-layers” (valores extremadamente altos o
extremadamente bajos en comparación del resto de los valores).
S Otro inconveniente es que dos distribuciones pueden tener el mismo rango

pero si se grafica la distribución, se observaría diferencias muy importantes.

(Guía de clase)
O La varianza es un estadístico que informa sobre cuál es la “distancia

promedio” de las observaciones a la media aritmética de una
distribución.
O El desvío estándar se define como la raíz cuadrada de la varianza y
suele ser más utilizada para fines descriptivos por razones de practicidad
se utiliza más frecuentemente. En el campo de la estadística inferencial
el desvío estándar presenta dificultades por lo que por lo general se usa
en su la varianza.
C. La varianza y el desvío estándar se calculan siguiendo la misma

idea de encontrar un promedio en las dispersiones de los valores
observados respecto a su media.
O La varianza se define como el promedio de los cuadrados de las

desviaciones a la media aritmética y se expresa algebraicamente en la
siguiente forma:
S2 =
∑ (x i − x ) 2
O El desvió o desviación estándar es la raíz cuadrada de la varianza.

Como se apreciará en el cuadro 18.1, sus valores son sensiblemente
más reducidos y por tanto manipulables.

(Guía de clase)
S =2 ∑ (x i− x) 2
N
D. Algunas características de la varianza y del desvío son:
O Los símbolos utilizados para identificar a la varianza pueden ser distintos

según el contexto estadístico en que se los está utilizando:
i) Las letra griega “F 2" (sigma) se utiliza para indicar que la varianza ha
sido calculada en una población (registrada en un censo).
ii) Las letras latinas “S2” mayúscula y “s2” minúscula se emplean por lo
general para referirse a las varianzas y también los desvíos pero sin
el cuadrado) que se calculan en una muestra. En tal caso, se dirá que
la varianza calculada en una muestra (“s2”) es un estimador de la
varianza poblacional (“F 2" ).
iii) También puede representarse con la letra “V”.
O La varianza nunca tendrá valores negativos.
S Esto se deriva de la propia fórmula, donde cualquiera sea el signo de las

desviaciones a la media, al elevarse al cuadrado tomarán valores positivos
(esta es la primera propiedad de la varianza). Formalmente:
S2 ≥ 0

(Guía de clase)
S Si la varianza toma valor 0, entonces se trata de una variable que toma el

mismo valor en todas las unidades. Es decir, se trata de una constante. Si se
recuerda que una de las propiedades de la media aritmética informa que la
media de la constante es igual a la constante, formalmente se tiene que:
S (k ) =
2 ∑ (k i− k)2
=
0
=0
N N
Es de observarse que la anterior es la segunda propiedad de la

varianza.
O La varianza es sensible a la presencia de valores extremos, tal como lo

es la media aritmética, aunque es más estable que esta. En el cuadro
siguiente se ha presentado el mismo ejemplo de la Ficha nº17, y se ha
calculado la varianza para cada una de las tres regiones.
E. Siguiendo a Cortés (2000:159 y ss) distinguiremos las siguientes

otras cuatro propiedades de la varianza.
O Tercera propiedad: al sumar una constante a los valores originales de

la variable, la varianza no se modifica.
i) Formalmente:
S 2 (K + X ) = S 2 ( X )
ii) En el cuadro anterior, la columna que identifica a la región “D” presenta
una distribución del ingreso con los mismos valores que en la región
“A” pero se le han agregado 100U$S a cada hogar. Si se observa la

(Guía de clase)
media se ha incrementado en 100 U$S (tercera propiedad de la media,

Ficha nº17) pero la varianza y el desvío no se han modificado.
iii) Se demuestra que:
S (K + X ) =
2 ∑ (K + Xi − K + X )2
N
Re ordenando:
∑ (X i − X + K − K) 2
S 2 (K + X ) =
N
∑ ( Xi − X )2
S (K + X ) =
2
N
S 2 (K + X ) = S 2 ( X )
O Cuarta propiedad: si se multiplican los valores de la variable por una
constante, la varianza de la nueva variable resultante será igual a la
varianza original por la constante.
i) Formalmente:
S 2 (K * X ) = K 2 * S 2 ( X )
ii) Por las propiedades de la media, se recuerda que en este caso la
media de la nueva variable será igual a la media original por la
constante. De aquí que:

(Guía de clase)
S (K * X ) =
2 ∑ (K * X i− K * X )2
N
Re ordenando:
S (K * X ) =
2 ∑ [ K( X i − X )]2
N
K 2 ∑ ( Xi − X )2
S (K * X ) =
2
N
S (K * X ) = K * S ( X )
2 2 2

(Guía de clase)
Cuadro 18.1
Simulación de ingresos de los hogares en tres regiones
(Valores en dólares)
Ingreso en la Ingreso en la Ingreso en la Ingreso en la Ingreso en la
Región “A” Región “B” Región “C” Región “D” Región “E”
Hogar 1 828,2 828,2 828,2 928.2 8282.0
Hogar 2 675,0 675,0 675,0 775.0 6750.0
Hogar 3 603,3 603,3 603,3 703.3 6033.3
Hogar 4 804,8 804,8 804,8 904.8 8047.5
Hogar 5 400,0 400,0 400,0 500.0 4000.0
Hogar 6 1066,7 1066,7 1066,7 1166.7 10666.7
Hogar 7 2145,0 2145,0 2145,0 2245.0 21450.0
Hogar 8 635,5 635,5 635,5 735.5 6355.0
Hogar 9 760,5 760,5 760,5 860.5 7605.0
Hogar 10 525,0 525,0 525,0 625.0 5250.0
Hogar 11 1731,2 1731.2 1731,2 1831.2 17311.7
Hogar 12 279,0 279.0 279,0 379.0 2790.0
Hogar 13 275,0 275.0 275,0 375.0 2750.0
Hogar 14 482,6 482.6 483,0 582.6 4825.8
Hogar 15 475,2 475.2 475,2 575.2 4751.7
Hogar 16 333,3 333,3 333,3 433.3 3333.3
Hogar 17 525,0 525,0 525,0 625.0 5250.0
Hogar 18 781,8 781,8 781,8 881.8 7818.3
Hogar 19 992,3 992,3 992,3 1092.3 9922.5
Hogar 20 722,7 722,7 722,7 822.7 7226.7
Hogar 21 625,0 6250,0 62,5 725.0 6250.0
Hogar 22 1274,3 12743,0 127,4 1374.3 12743.3
Hogar 23 1373,5 13735,0 137,4 1473.5 13735.0
Media aritmética 796,29 2076,96 668,25 896.29 7962.95
Varianza 215490.70 13922922,52 236022,75 215490.70 21549069.56
Desvío estándar 464.21 3731,34 485,82 464.21 4642.10
Fuente: los valores para la región “A” han sido tomados de la Encuesta Continua de Hogares (ECH) del Uruguay
para el año 2001 y corresponden a 23 hogares tomados de un departamento del Interior.

(Guía de clase)
O Quinta propiedad: si los valores originales de uan variable se

multiplican por una constante (K1) y luego se le suma otra constante (K2),
la varianza de la nueva variable será igual al cuadrado de la constante
K1 por la varianza original.
i) Se demuestra que es una combinación de las dos anteriores
S ( K1 + K2 * X ) =
2 ∑ [( K + K2 * X ) − ( K1 + K2 * X )]2
1
S 2 ( K1 + K2 * X ) =
∑ [( K1 − K1 ) + ( K2 * X ) − ( K2 * X )]2
N
S 2 ( K1 + K2 * X ) =
∑ [( K2 * X ) − ( K2 * X )]2
N
S 2 ( K1 + K2 * X ) =
∑ [K2 ( X i − X )]2
N
K 2 ∑ ( X i − X )]2
S 2 ( K1 + K2 * X ) =
N
S 2 ( K1 + K2 * X ) = 2 2
K *S (X)
propiedades:
O Sexta propiedad: la varianza de un conjunto de observaciones

clasificadas según las categorías de otra variable (nominal u ordinal) es
igual a la suma de la intervarianza y la intravarianza.
i) La propiedad se conoce también con el nombre de “descomposición

de la varianza y es muy recurrida en distintas aplicaciones estadísticas.

(Guía de clase)
ii) A pesar de que en su demostración están involucradas dos variables

(la variable de interés, X, y la variable categórica, Z) , en este caso
puntual no se trata de una forma de análisis bivariado, aunque
luego dará lugar a una técnica específica: el análisis de varianza.
iii) En el cuadro 18.2 se presenta esquemáticamente la propiedad.
iv) La varianza de X en cada categoría de Z, (S2 j), se denomina varianzas

internas; el promedio ponderado de éstas genera la intravarianza (S
2
w ). La varianza que se calcula a partir de las medias aritméticas de
cada una de las categorías de Z, se denomina intervarianza (S 2 B).
Cuadro 18.2
Esquema de la descomposición de la varianza
Variable Z Número de casos de X Promedios para X Varianzas de X en cada
en cada categoría de Z en cada categoría de Z categoría de Z
(ni)
Categoría A Na 0a S2 a
Categoría B Nb 0b S2 b
Categoría C Nc 0c S2 c
... ... ... ...
Categoría J Nj 0j S2 j
Total N 0 S2

(Guía de clase)
iv) Formalmente, la propiedad establece que:
S 2 T = S B 2 + SW 2
v) Donde:
S 2
=
∑S 2
i * Ni
W
N
S 2
=
∑ (Y i− Y)2
B
N


Medidas de Dispersión

Cargado por

Copyright:

Formatos disponibles

Medidas de Dispersión

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Medidas de Dispersión

Cargado por

Copyright:

Formatos disponibles

MEDIDAS DE DISPERSIÓN

A. Una pregunta muy particular que se puede hacer a una

O Las medidas de dispersión generalmente acompañan a las

O Conceptualmente, la pregunta por una estimación de la heterogeneidad

O La comparación de las medidas de desigualdad entre dos colectivos (por

O Por lo general, las medidas de dispersión se utilizan conjuntamente con

O La diferencia entre las medidas obedece a una pregunta: ¿mayor o

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

menor dispersión respecto de qué?.

S Las medidas que se han ido desarrollando constituyen sofisticaciones

S Por principio, las medidas de dispersión ubican su referente de dispersión en

B. Las medidas de dispersión más frecuentemente utilizadas son el

O Una medida simple que se podría proponer para analizar la dispersión

S Tiene un inconveniente importante: el rango puede tomar valores máximos y

S Otro inconveniente es que dos distribuciones pueden tener el mismo rango

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

O La varianza es un estadístico que informa sobre cuál es la “distancia

C. La varianza y el desvío estándar se calculan siguiendo la misma

O La varianza se define como el promedio de los cuadrados de las

O El desvió o desviación estándar es la raíz cuadrada de la varianza.

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

D. Algunas características de la varianza y del desvío son:

O Los símbolos utilizados para identificar a la varianza pueden ser distintos

iii) También puede representarse con la letra “V”.

O La varianza nunca tendrá valores negativos.

S Esto se deriva de la propia fórmula, donde cualquiera sea el signo de las

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

S Si la varianza toma valor 0, entonces se trata de una variable que toma el

Es de observarse que la anterior es la segunda propiedad de la

O La varianza es sensible a la presencia de valores extremos, tal como lo

E. Siguiendo a Cortés (2000:159 y ss) distinguiremos las siguientes

O Tercera propiedad: al sumar una constante a los valores originales de

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

media se ha incrementado en 100 U$S (tercera propiedad de la media,

iii) Se demuestra que:

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

O Quinta propiedad: si los valores originales de uan variable se

i) Se demuestra que es una combinación de las dos anteriores

O Sexta propiedad: la varianza de un conjunto de observaciones

i) La propiedad se conoce también con el nombre de “descomposición

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

ii) A pesar de que en su demostración están involucradas dos variables

iii) En el cuadro 18.2 se presenta esquemáticamente la propiedad.

iv) La varianza de X en cada categoría de Z, (S2 j), se denomina varianzas

... ... ... ...

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

iv) Formalmente, la propiedad establece que:

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS

También podría gustarte