Tema 4 Variabilidad y Dispersi N
Tema 4 Variabilidad y Dispersi N
Tema 4 Variabilidad y Dispersi N
Medidas de dispersión y
variabilidad
1. Introducción
2. Estadísticos basados directamente en las puntuaciones
1. Varianza y desviación típica
2. Rango o amplitud total
3. Coeficiente de variación
3. Estadísticos basados directamente en rangos (resistentes/robustos)
1. Amplitud semi-intercuartil
2. DEMA o media de las desviaciones absolutas con respecto a
la mediana
3. Coeficiene de variación robusto
4. El diagrama de caja (Box-Plot) como resumen de tendencia central
y dispersión
1
1. Introducción
2
Medidas de variabilidad
• Necesidad. Las medidas de tendencia central tratan
de resumir en una sola cifra la magnitud general de
un conjunto de datos. No obstante, dos conjuntos
pueden tener la misma media y ser muy distintos
X: Notas del grupo A en Conocimiento del medio
Xi: 4, 5, 6, 7, 8, 9 10
Media = 7
4
2. Estadísticos basados
directamente en las puntuaciones
5
Varianza y desviación típica
• Una forma intuitiva de definir la dispersión respecto de la
media sería: obtener las desviaciones (diferencias) de cada
puntuación con respecto a la media, sumar dichas
diferencias y, por último, promediarlas; pero el valor
resultante es siempre 0 (propiedad)
• Una solución es elevar las desviaciones al cuadrado y
promediarlas, es decir, obtener la media de las
desviaciones al cuadrado: varianza de la distribución
S2 ESTADÍSTICO (Muestra)
2 PARÁMETRO (Población)
• La raíz cuadrada de la varianza es la desviación típica 6
Varianza y desviación típica
Cálculo
n
X X i
2
(X 1 X ) 2 (X 2 X ) 2 ... (X n X ) 2
sx2 i1
n n
n
X i2
Fórmula alternativa
s x2 i 1 X2
n
n
Xi X
2
Varianza insesgada
s x2 i 1 (cuasi-varianza)
n 1 7
Varianza y desviación típica
Ejemplos
Xi: 24, 26, 25; X 25 Yi: 50, 1, 24; Y 25
Desviación típica
sx s 2
x
8
Propiedades de la varianza/desviación
típica (1)
1. Varianza de puntuaciones transformadas linealmente
Sean Xi: X1, X2,…, Xn y Vi = b Xi+ a (transformación lineal de
X), donde a y b son constantes (b ≠ 0)
s2v = b2s2x Ordenada en el origen
sv = |b| sx Pendiente
Ejemplo
Xi: 24, 26, 25; X 25 S2X = 0’67 23 24 25 26 27
Vi = Xi – 20; Vi : 4, 6, 5
3 4 5 6 7
H = a Xi+bYi, ( a ≠0 y b ≠0)
11
Rango o amplitud total
• Se define como la distancia entre la puntuación máxima y
la mínima
ATx = Xmax- Xmin
Ejemplo
Xi: 24, 26, 25 ATx = 26 – 24 = 2
Ejemplo
Xi:5000, 15000,… X 6000 m Sx= 500 m
Yi: 1’6, 1’63, 1’7,… Y 1'35 m Sy= 0’8 m
¿500 m > 0,8 m?
500 0'8
CVx 100 8'3 CV y 100 59'25
| 6000 | 1'35
15
Medidas de variación resistentes (1)
Amplitud semi-intercuartil
(Q 3 Q1) (Semi-distancia entre el Q3 y el Q1)
ASI
2
• Adecuada para variables cuantitativas
• Menos sensible que la varianza a la variación de los
datos (resistente/robusto)
• Más apropiado que la varianza para distribuciones muy
asimétricas (resistente/robusto)
• Misma métrica que la variable
• Amplitud intercuartil (AI): distancia entre el Q3 y el Q1
16
Medidas de variación resistentes (2)
Dema
n (Media de las desviaciones absolutas
DEMA | X i Mdn |
n
con respecto a la mediana)
i1
18
Diagrama de Caja: Box-Plot
BIGOTES
CAJA
19
Diagrama de Caja: Box-Plot
4 6 8 10 20
Diagrama de Caja: Box-Plot
ATÍPICAS EXTREMAS
Externa_sup.
(Q3 + 3AI) = 10,26
ATÍPICAS
MODERADAS Interna_sup.
(Q3 + 1,5AI) = 8,88
Q3
NO ATÍPICAS Q2
Q1
Interna_inf.
(Q1 - 1,5AI) = 5,20
ATÍPICAS
MODERADAS
Externa_inf.
(Q1 – 3AI) = 3,82
ATÍPICAS EXTREMAS
21
Diagrama de Caja: Box-Plot
ATÍPICAS EXTREMAS
Externa_sup.
(Q3 + 3AI) = 10,26
ATÍPICAS
MODERADAS Interna_sup.
(Q3 + 1,5AI) = 8,88
Q3
NO ATÍPICAS Q2
Q1
Interna_inf.
(Q1 - 1,5AI) = 5,20
ATÍPICAS
MODERADAS
Externa_inf.
(Q1 – 3AI) = 3,82
ATÍPICAS EXTREMAS
22
Diagrama de Caja: Box-Plot
Estadísticos
notabup Media 7,0671
Mediana 7,0000
Mínimo 5,60
Máximo 8,90
Fronteras
50
40
78
106
30
20
109
158
175
19
10
0
N= 185 185 185 185 185
24