0 - Sesión 4 - EYP
0 - Sesión 4 - EYP
0 - Sesión 4 - EYP
92.9 93.6 95.7 93.8 94.8 93.9 92.7 91.6 93.6 93.7
94.2 95.7 94.7 94.3 92.7 94.5 96.2 95.4 93.7 91.9
94.7 92.7 95.0 93.0 92.9 93.7 92.7 93.3 94.6 96.4
• El rango
•
. •
El rango intercuartil
El rango interdecil
• Desviación media
• Desviación mediana
• La varianza
• La desviación estandar
• El coeficiente de variación
Rango - rango intercuartil
DEFINICIÓN: El rango o recorrido, 𝑹,para una serie de datos es la diferencia entre
sus valores máximos y minimos.
𝑹 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
𝑹𝑰 = 𝑸𝟑 − 𝐐𝟏
.
Ventajas y desventajas:
• Considera a todos los datos, se toma en cuenta si todos los datos son mas
representativos por la media, es menos sensible a valores extremos.
• Es muy operativa.
Desviación mediana
Datos no agrupados Datos agrupados
Sean los datos 𝑥1, 𝑥2, … , 𝑥𝑛 no nulos de Sean los marcas de clase 𝑥1, 𝑥2, … , 𝑥𝑘 de
la variable 𝑋, entonces la distribución de frecuencias para
𝑋, con respectivas 𝑓1 , 𝑓2, … , 𝑓𝑘 entonces
σ𝑛𝑖=1 𝑥𝑖 − 𝑀𝑒 σ𝑛𝑖=1 𝑓𝑖 𝑥𝑖 −𝑀𝑒
𝐷𝑀 =
𝑛
𝐷𝑀 =
𝑛
Nota: Si la cantidad de datos de una muestra es mayor de 60, se puede aplicar
la varianza poblacional.
Forma reducida de la varianza muestral:
𝟐 σ𝒏 𝟐
𝒊=𝟎 𝒙𝒊 −𝒏ഥ𝒙𝟐 𝟐 σ𝒏 𝟐 𝒙𝟐
𝒊=𝟎 𝒇𝒊 .𝒙𝒊 −𝒏ഥ
𝑺 = ; 𝑺 =
𝒏−𝟏 𝒏−𝟏
• Esta medida es mas recomendable que la varianza, pues muestra la dispersión de los
datos en las mismas unidades de la variable.
• Sus propiedades son similares a la varianza.
• La varianza y la desviación estándar son las medidas mas usadas.
El coeficiente de variación se utiliza para comparar la variabilidad de dos o mas
series de datos que tengan medias iguales o diferentes o que tengan unidades de
medida iguales o diferentes (una serie en metros y otra en kilogramos).
A menor valor de CV decimos que la serie de datos tiene menos variabilidad.
Desigualdad de Chebyshev
Cualquiera sea la forma de la distribución de frecuencias (simétrica o asimetrica), el intervalo
ഥ
𝒙 − 𝒌𝒔𝑿, ഥ
𝒙 + 𝒌𝒔𝑿 , 𝒌 > 𝟏 contiene por lo menos el
𝟏
𝟏− en % de los datos.
𝒌𝟐
𝟏
𝒌𝟐
𝒆𝒏 %.
Ejercicio
Los puntajes obtenidos en una prueba de conocimientos tiene una media igual a 8. Si el
coeficiente de variación de los puntajes es igual a 0.25.
a. Determine el porcentaje de evaluados cuyos puntajes estén comprendidos en el
intervalo [04, 12].
USO DE LA MEDIDAS DE DISPERSIÓN
Recordar que la varianza es expresada en unidades cuadráticas de los datos. La desviación
estándar viene expresada en las mismas unidades que los datos. El CV se expresa en
números abstractos (se suprimen sus unidades).
1. Si dos o más series de datos tienen medias iguales o casi iguales es mas dispersa la
serie que tenga mayor medida de dispersión: Rango o RI o 𝑠 2 o 𝑠 o CV. Si hay marcada
asimetría es preferible comparar con el RI.
2. Si dos o mas series de datos, no tiene medias iguales (o casi iguales), o no tienen las
mismas unidades de medición, entonces, es mas dispersa las serie de mayor CV.
NOTA:
• Cuando se necesiten comparar valores observados que pertenecen a diferentes
distribuciones de dos o mas muestras, que difieren en su 𝑥ҧ o 𝑠 2 o difieren en el tipo de
unidades de medición, entonces se usa el valor estandar 𝑍 que se define
DEMUESTRA LO APRENDIDO