Estadística Descriptiva Avanzada
Estadística Descriptiva Avanzada
Estadística Descriptiva Avanzada
Finanzas
Prof.: H. Ernesto Sheriff, PhD(c) – M.Sc.
Sesión 5
• Cuartiles, deciles y percentiles
• Los cuatiles dividen a un conjunto de datos en
cuatro partes iguales.
• Para explicarlo un poco mejor, piense en un
conjunto de datos ordenados de menor a
mayor. Al valor de en medio es la mediana.
Esto es, 50 por ciento de los datos son
mayores que la mediana y 50 por ciento son
menores. De manera similar los cuartiles
dividen a un conjunto de datos en cuatro
partes iguales.
• El primer cuartil, al que se le llama Q1, es el valor por
debajo del cual se encuentra el 25% de los datos, y el
tercer cuartil usualmente llamado Q3, es el valor por
debajo de el se encuentra el 75% de los datos. Q2 es
la mediana.
• Los valores Q1, Q2 y Q3 dividen al conjunto de datos
ordenados en cuatro partes iguales. Q1 se puede
entender como la mediana de la mitad inferior de los
datos ordenados y Q3 como la mediana de la mitad
superior de los datos ordenado.
• Procedimiento para el calculo de los percentiles
• Sea Lp la posición del percentil deseado.
• Entonces
p
L p ( n)
100
• donde n es el numero de datos y p el percentil
• Ejemplo: el percentil 33 P33, el percentil 50 es el P50,
que es también la mediana ó el Q2. El percentil 25 es
el P25=Q1 y el percentil 75 es el P75=Q3
• Calculo del p-ésimo percentil
• Paso 1: Ordenar los datos de manera ascendente.
• Paso 2: Calculamos el Lp ( )
p
L ( n)
• Paso 3: a) Si Lp no es entero, se redondea.
p
100
%
El valor
entero inmediato mayor que Lp indica la posición del
p-ésimo percentil.
• b) Si Lp es entero, el p-ésimo persentil es el promedio
de los valores de los datos ubicados en los lugares i e
i+1
• Por Ejemplo:
• Si tenemos 15 datos ordenados y que-remos localizar
el primer cuartil (percentil 25) según la formula este
estará ubicado en la posición 4 (por redondeo) y el
tercer cuartil (percentil 75) estará ubicado en la
posición 12 (por redondeo)
• Si tenemos 20 datos ordenados el primer cuartil
estara en la posición intermedia entre el 5° y el 6°
dato es decir si el 5° dato fuese 36 y el 6° 41 el
P25=Q1=38,5
Asimetría y curtosis
• Asimetría
• Si los valores de la serie de datos presenta la misma
forma a izquierda y derecha de un valor central
(media aritmética) se dice que es simétrica de lo
contrario será asimétrica.
• Para medir el nivel de asimetría se utiliza el llamado
Coeficiente de Asimetría de Fisher, que viene
definido:
n
(1 / n)( ( xi x ) 3
g1 i 1
3
s
• Los resultados pueden ser los siguientes:
• g1 = 0 (distribución simétrica; existe la misma
concentración de valores a la derecha y a la izquierda
de la media)
• g1 > 0 (distribución asimétrica positiva; existe mayor
concentración de valores a la derecha de la media
que a su izquierda)
• g1 < 0 (distribución asimétrica negativa; existe mayor
concentración de valores a la izquierda de la media
que a su derecha)
• Curtosis
• El Coeficiente de Curtosis analiza el grado de
concentración que presentan los valores
alrededor de la zona central de la distribución.
• Se definen 3 tipos de distribuciones según su
grado de curtosis:
• Distribución mesocúrtica: presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una
distribución normal).
• Distribución leptocúrtica: presenta un elevado grado
de concentración alrededor de los valores centrales
de la variable.
• Distribución platicúrtica: presenta un reducido grado
de concentración alrededor de los valores centrales
de la variable.
• El Coeficiente de Curtosis viene definido por la
siguiente fórmula:
n
(1 / n)( ( xi x ) 4
g2 i 1
4
3
s
• Los resultados pueden ser los siguientes:
• g2 = 0 (distribución mesocúrtica).
• g2 > 0 (distribución leptocúrtica).
• g2 < 0 (distribución platicúrtica).
Organización y Presentación de datos
Bivariados
Datos bivariados categóricos
Para organizar datos de dos variables
categóricas o cualitativas se usan tablas de
doble entrada. Los valores de una variable
van en columnas y los valores de la otra
variable van en filas.
Conjunto de datos que contienen
una variable cualitativa y otra
cuantitativa
• La forma estándar de presentar los datos es en
columnas donde cada columna representa un
valor de la variable cualitativa y los valores
dentro de cada columna representan valores de la
variable cuantitativa.
• En general el objetivo es comparar los valores de
la variable cualitativa según los valores de la
variable cuantitativa, esto se lleva a cabo con una
técnica llamada análisis de varianza
• La gráfica más adecuada para representar este
tipo de información es el "Boxplot".
Datos Bivariados Continuos