Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Estadística Descriptiva Avanzada

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 17

Matemáticas y Estadística para

Finanzas
Prof.: H. Ernesto Sheriff, PhD(c) – M.Sc.

Sesión 5
• Cuartiles, deciles y percentiles
• Los cuatiles dividen a un conjunto de datos en
cuatro partes iguales.
• Para explicarlo un poco mejor, piense en un
conjunto de datos ordenados de menor a
mayor. Al valor de en medio es la mediana.
Esto es, 50 por ciento de los datos son
mayores que la mediana y 50 por ciento son
menores. De manera similar los cuartiles
dividen a un conjunto de datos en cuatro
partes iguales.
• El primer cuartil, al que se le llama Q1, es el valor por
debajo del cual se encuentra el 25% de los datos, y el
tercer cuartil usualmente llamado Q3, es el valor por
debajo de el se encuentra el 75% de los datos. Q2 es
la mediana.
• Los valores Q1, Q2 y Q3 dividen al conjunto de datos
ordenados en cuatro partes iguales. Q1 se puede
entender como la mediana de la mitad inferior de los
datos ordenados y Q3 como la mediana de la mitad
superior de los datos ordenado.
• Procedimiento para el calculo de los percentiles
• Sea Lp la posición del percentil deseado.
• Entonces
p
L p  ( n)
100
• donde n es el numero de datos y p el percentil
• Ejemplo: el percentil 33 P33, el percentil 50 es el P50,
que es también la mediana ó el Q2. El percentil 25 es
el P25=Q1 y el percentil 75 es el P75=Q3
• Calculo del p-ésimo percentil
• Paso 1: Ordenar los datos de manera ascendente.
• Paso 2: Calculamos el Lp ( )
p
L  ( n)
• Paso 3: a) Si Lp no es entero, se redondea.
p
100
%
El valor
entero inmediato mayor que Lp indica la posición del
p-ésimo percentil.
• b) Si Lp es entero, el p-ésimo persentil es el promedio
de los valores de los datos ubicados en los lugares i e
i+1
• Por Ejemplo:
• Si tenemos 15 datos ordenados y que-remos localizar
el primer cuartil (percentil 25) según la formula este
estará ubicado en la posición 4 (por redondeo) y el
tercer cuartil (percentil 75) estará ubicado en la
posición 12 (por redondeo)
• Si tenemos 20 datos ordenados el primer cuartil
estara en la posición intermedia entre el 5° y el 6°
dato es decir si el 5° dato fuese 36 y el 6° 41 el
P25=Q1=38,5
Asimetría y curtosis
• Asimetría
• Si los valores de la serie de datos presenta la misma
forma a izquierda y derecha de un valor central
(media aritmética) se dice que es simétrica de lo
contrario será asimétrica.
• Para medir el nivel de asimetría se utiliza el llamado
Coeficiente de Asimetría de Fisher, que viene
definido:
n
(1 / n)( ( xi  x ) 3

g1  i 1
3
s
• Los resultados pueden ser los siguientes:
• g1 = 0 (distribución simétrica; existe la misma
concentración de valores a la derecha y a la izquierda
de la media)
• g1 > 0 (distribución asimétrica positiva; existe mayor
concentración de valores a la derecha de la media
que a su izquierda)
• g1 < 0 (distribución asimétrica negativa; existe mayor
concentración de valores a la izquierda de la media
que a su derecha)
• Curtosis
• El Coeficiente de Curtosis analiza el grado de
concentración que presentan los valores
alrededor de la zona central de la distribución.
• Se definen 3 tipos de distribuciones según su
grado de curtosis:
• Distribución mesocúrtica: presenta un grado de
concentración medio alrededor de los valores
centrales de la variable (el mismo que presenta una
distribución normal).
• Distribución leptocúrtica: presenta un elevado grado
de concentración alrededor de los valores centrales
de la variable.
• Distribución platicúrtica: presenta un reducido grado
de concentración alrededor de los valores centrales
de la variable.
• El Coeficiente de Curtosis viene definido por la
siguiente fórmula:
n
(1 / n)( ( xi  x ) 4
g2  i 1
4
3
s
• Los resultados pueden ser los siguientes:
• g2 = 0 (distribución mesocúrtica).
• g2 > 0 (distribución leptocúrtica).
• g2 < 0 (distribución platicúrtica).
Organización y Presentación de datos
Bivariados
Datos bivariados categóricos
Para organizar datos de dos variables
categóricas o cualitativas se usan tablas de
doble entrada. Los valores de una variable
van en columnas y los valores de la otra
variable van en filas.
Conjunto de datos que contienen
una variable cualitativa y otra
cuantitativa
• La forma estándar de presentar los datos es en
columnas donde cada columna representa un
valor de la variable cualitativa y los valores
dentro de cada columna representan valores de la
variable cuantitativa.
• En general el objetivo es comparar los valores de
la variable cualitativa según los valores de la
variable cuantitativa, esto se lleva a cabo con una
técnica llamada análisis de varianza
• La gráfica más adecuada para representar este
tipo de información es el "Boxplot".
Datos Bivariados Continuos

Si se quiere representar la relación entre dos


variables cuantitativas entonces se usa un
diagrama de dispersión (“Scatterplot”).
El Coeficiente de Correlación
Llamado también coeficiente de correlación de Pearson, se representa por r y es
una medida que representa el grado de asociación entre dos variables cuantitativas
X e Y.

Sxx es llamada la Suma de Cuadrados corregida de X, Syy es la Suma de


Cuadrados Corregida de Y, y Sxy es la Suma de Productos de X e Y. Tanto
Sxx como Syy no pueden ser negativas, Sxy si puede ser positiva o negativa.
La correlación varia entre -1 y 1.

También podría gustarte