Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Medidas de Dispersión

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 11

MEDIDAS DE DISPERSIÓN

(Guía de clase)

A. Una pregunta muy particular que se puede hacer a una

FICHA Nº 18
distribución de datos es de qué magnitud es
es la heterogeneidad que se observa.

O Las medidas de dispersión generalmente acompañan a las


medidas de tendencia central por una razón básica: la media aritmética
informa sobre cuál es el centro de gravedad pero qué tan homogénea es
la distribución.

O Conceptualmente, la pregunta por una estimación de la heterogeneidad


está en la base de los estudios de desigualdad en la distribución del
ingreso, de bienes culturales, del acceso a servicios sociales.

O La comparación de las medidas de desigualdad entre dos colectivos (por


ejemplo, desigualdad de aprendizajes entre escuelas; ingresos entre
países; de ingresos entre años distintos) constituye un enfoque problema
de investigación que se pregunta en qué difieren dos casos de interés.

O Por lo general, las medidas de dispersión se utilizan conjuntamente con


las medidas de tendencia central. De hecho, en algunas de las fórmulas
para su cálculo se emplea directamente la media aritmética como
referencia de dispersión.

O La diferencia entre las medidas obedece a una pregunta: ¿mayor o

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

menor dispersión respecto de qué?.

S Las medidas que se han ido desarrollando constituyen sofisticaciones


matemáticas a las sucesivas respuestas dadas a esta pregunta.

S Por principio, las medidas de dispersión ubican su referente de dispersión en


la propia distribución observada de los datos y no en relación de un parámetro
ideal o deseable. Este no es el caso en todas las medidas de desigualdad. En
el caso del índice de Gini para medir concentración y desigualdad, su
referente es ideal: una distribución completamente democrática.

B. Las medidas de dispersión más frecuentemente utilizadas son el


rango, la varianza y el desvío estándar.

O Una medida simple que se podría proponer para analizar la dispersión


es el rango. Éste se define la distancia entre el valor mínimo y el
máximo observados.

S Esta medida permitiría observar qué tan amplia es la distribución. Una medida
importante por ejemplo, cuando se comparan tamaños de hogares en
distintos países o regiones de América Latina.

S Tiene un inconveniente importante: el rango puede tomar valores máximos y


mínimos que son atípicos (con una frecuencia simple de 1, por ejemplo) o
muy desviados o “out-layers” (valores extremadamente altos o
extremadamente bajos en comparación del resto de los valores).

S Otro inconveniente es que dos distribuciones pueden tener el mismo rango


pero si se grafica la distribución, se observaría diferencias muy importantes.

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

O La varianza es un estadístico que informa sobre cuál es la “distancia


promedio” de las observaciones a la media aritmética de una
distribución.
O El desvío estándar se define como la raíz cuadrada de la varianza y
suele ser más utilizada para fines descriptivos por razones de practicidad
se utiliza más frecuentemente. En el campo de la estadística inferencial
el desvío estándar presenta dificultades por lo que por lo general se usa
en su la varianza.

C. La varianza y el desvío estándar se calculan siguiendo la misma


idea de encontrar un promedio en las dispersiones de los valores
observados respecto a su media.

O La varianza se define como el promedio de los cuadrados de las


desviaciones a la media aritmética y se expresa algebraicamente en la
siguiente forma:

S2 =
∑ (x i − x ) 2

O El desvió o desviación estándar es la raíz cuadrada de la varianza.


Como se apreciará en el cuadro 18.1, sus valores son sensiblemente
más reducidos y por tanto manipulables.

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

S =2 ∑ (x i− x) 2
N

D. Algunas características de la varianza y del desvío son:

O Los símbolos utilizados para identificar a la varianza pueden ser distintos


según el contexto estadístico en que se los está utilizando:

i) Las letra griega “F 2" (sigma) se utiliza para indicar que la varianza ha
sido calculada en una población (registrada en un censo).

ii) Las letras latinas “S2” mayúscula y “s2” minúscula se emplean por lo
general para referirse a las varianzas y también los desvíos pero sin
el cuadrado) que se calculan en una muestra. En tal caso, se dirá que
la varianza calculada en una muestra (“s2”) es un estimador de la
varianza poblacional (“F 2" ).

iii) También puede representarse con la letra “V”.

O La varianza nunca tendrá valores negativos.

S Esto se deriva de la propia fórmula, donde cualquiera sea el signo de las


desviaciones a la media, al elevarse al cuadrado tomarán valores positivos
(esta es la primera propiedad de la varianza). Formalmente:

S2 ≥ 0

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

S Si la varianza toma valor 0, entonces se trata de una variable que toma el


mismo valor en todas las unidades. Es decir, se trata de una constante. Si se
recuerda que una de las propiedades de la media aritmética informa que la
media de la constante es igual a la constante, formalmente se tiene que:

S (k ) =
2 ∑ (k i− k)2
=
0
=0
N N

Es de observarse que la anterior es la segunda propiedad de la


varianza.

O La varianza es sensible a la presencia de valores extremos, tal como lo


es la media aritmética, aunque es más estable que esta. En el cuadro
siguiente se ha presentado el mismo ejemplo de la Ficha nº17, y se ha
calculado la varianza para cada una de las tres regiones.

E. Siguiendo a Cortés (2000:159 y ss) distinguiremos las siguientes


otras cuatro propiedades de la varianza.

O Tercera propiedad: al sumar una constante a los valores originales de


la variable, la varianza no se modifica.

i) Formalmente:

S 2 (K + X ) = S 2 ( X )
ii) En el cuadro anterior, la columna que identifica a la región “D” presenta
una distribución del ingreso con los mismos valores que en la región
“A” pero se le han agregado 100U$S a cada hogar. Si se observa la

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

media se ha incrementado en 100 U$S (tercera propiedad de la media,


Ficha nº17) pero la varianza y el desvío no se han modificado.

iii) Se demuestra que:

S (K + X ) =
2 ∑ (K + Xi − K + X )2
N
Re ordenando:
∑ (X i − X + K − K) 2
S 2 (K + X ) =
N
∑ ( Xi − X )2
S (K + X ) =
2
N
S 2 (K + X ) = S 2 ( X )
O Cuarta propiedad: si se multiplican los valores de la variable por una
constante, la varianza de la nueva variable resultante será igual a la
varianza original por la constante.

i) Formalmente:

S 2 (K * X ) = K 2 * S 2 ( X )
ii) Por las propiedades de la media, se recuerda que en este caso la
media de la nueva variable será igual a la media original por la
constante. De aquí que:

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

S (K * X ) =
2 ∑ (K * X i− K * X )2
N
Re ordenando:

S (K * X ) =
2 ∑ [ K( X i − X )]2
N
K 2 ∑ ( Xi − X )2
S (K * X ) =
2
N
S (K * X ) = K * S ( X )
2 2 2

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

Cuadro 18.1
Simulación de ingresos de los hogares en tres regiones
(Valores en dólares)
Ingreso en la Ingreso en la Ingreso en la Ingreso en la Ingreso en la
Región “A” Región “B” Región “C” Región “D” Región “E”
Hogar 1 828,2 828,2 828,2 928.2 8282.0
Hogar 2 675,0 675,0 675,0 775.0 6750.0
Hogar 3 603,3 603,3 603,3 703.3 6033.3
Hogar 4 804,8 804,8 804,8 904.8 8047.5
Hogar 5 400,0 400,0 400,0 500.0 4000.0
Hogar 6 1066,7 1066,7 1066,7 1166.7 10666.7
Hogar 7 2145,0 2145,0 2145,0 2245.0 21450.0
Hogar 8 635,5 635,5 635,5 735.5 6355.0
Hogar 9 760,5 760,5 760,5 860.5 7605.0
Hogar 10 525,0 525,0 525,0 625.0 5250.0
Hogar 11 1731,2 1731.2 1731,2 1831.2 17311.7
Hogar 12 279,0 279.0 279,0 379.0 2790.0
Hogar 13 275,0 275.0 275,0 375.0 2750.0
Hogar 14 482,6 482.6 483,0 582.6 4825.8
Hogar 15 475,2 475.2 475,2 575.2 4751.7
Hogar 16 333,3 333,3 333,3 433.3 3333.3
Hogar 17 525,0 525,0 525,0 625.0 5250.0
Hogar 18 781,8 781,8 781,8 881.8 7818.3
Hogar 19 992,3 992,3 992,3 1092.3 9922.5
Hogar 20 722,7 722,7 722,7 822.7 7226.7
Hogar 21 625,0 6250,0 62,5 725.0 6250.0
Hogar 22 1274,3 12743,0 127,4 1374.3 12743.3
Hogar 23 1373,5 13735,0 137,4 1473.5 13735.0
Media aritmética 796,29 2076,96 668,25 896.29 7962.95
Varianza 215490.70 13922922,52 236022,75 215490.70 21549069.56
Desvío estándar 464.21 3731,34 485,82 464.21 4642.10
Fuente: los valores para la región “A” han sido tomados de la Encuesta Continua de Hogares (ECH) del Uruguay
para el año 2001 y corresponden a 23 hogares tomados de un departamento del Interior.

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

O Quinta propiedad: si los valores originales de uan variable se


multiplican por una constante (K1) y luego se le suma otra constante (K2),
la varianza de la nueva variable será igual al cuadrado de la constante
K1 por la varianza original.

i) Se demuestra que es una combinación de las dos anteriores

S ( K1 + K2 * X ) =
2 ∑ [( K + K2 * X ) − ( K1 + K2 * X )]2
1

S 2 ( K1 + K2 * X ) =
∑ [( K1 − K1 ) + ( K2 * X ) − ( K2 * X )]2
N

S 2 ( K1 + K2 * X ) =
∑ [( K2 * X ) − ( K2 * X )]2
N

S 2 ( K1 + K2 * X ) =
∑ [K2 ( X i − X )]2
N
K 2 ∑ ( X i − X )]2
S 2 ( K1 + K2 * X ) =
N
S 2 ( K1 + K2 * X ) = 2 2
K *S (X)
propiedades:

O Sexta propiedad: la varianza de un conjunto de observaciones


clasificadas según las categorías de otra variable (nominal u ordinal) es
igual a la suma de la intervarianza y la intravarianza.

i) La propiedad se conoce también con el nombre de “descomposición


de la varianza y es muy recurrida en distintas aplicaciones estadísticas.

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

ii) A pesar de que en su demostración están involucradas dos variables


(la variable de interés, X, y la variable categórica, Z) , en este caso
puntual no se trata de una forma de análisis bivariado, aunque
luego dará lugar a una técnica específica: el análisis de varianza.

iii) En el cuadro 18.2 se presenta esquemáticamente la propiedad.

iv) La varianza de X en cada categoría de Z, (S2 j), se denomina varianzas


internas; el promedio ponderado de éstas genera la intravarianza (S
2
w ). La varianza que se calcula a partir de las medias aritméticas de
cada una de las categorías de Z, se denomina intervarianza (S 2 B).

Cuadro 18.2
Esquema de la descomposición de la varianza
Variable Z Número de casos de X Promedios para X Varianzas de X en cada
en cada categoría de Z en cada categoría de Z categoría de Z
(ni)

Categoría A Na 0a S2 a

Categoría B Nb 0b S2 b

Categoría C Nc 0c S2 c

... ... ... ...

Categoría J Nj 0j S2 j

Total N 0 S2

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández
MEDIDAS DE DISPERSIÓN
(Guía de clase)

iv) Formalmente, la propiedad establece que:

S 2 T = S B 2 + SW 2

v) Donde:

S 2
=
∑S 2
i * Ni
W
N

S 2
=
∑ (Y i− Y)2
B
N

EL COLEGIO DE MÉXICO - CENTRO DE ESTUDIOS SOCIOLÓGICOS


Programa de Doctorado en Ciencia Social : Estadística I (2003-2004)
Soc. Tabaré Fernández

También podría gustarte