Tema 5
Tema 5
Tema 5
Índice de Teachman(H):
Índices epidemiológicos:
•Prevalencia: es la proporción de casos detectados sobre el total de la población examinada.
• Incidencia: es la razón de nuevos casos detectados en un periodo de tiempo sobre el total
de la población a riesgo.
Usamos el índice de Blau (D) con todos los datos de Pi (0,334 , 0,309 , 0,237 y 0,12)
Ahora la proporción que usamos es mujeres 0,58 y hombres 0,42; esto es nuestro nuevo Pi
Hacemos índice de blau:
D= 1 – (0,58^2 + 0,42^2) = 0,49 (0 – 0,50)
Ahora nuestro índice esta entre 0 y 0,50
donde k es el percentil de interés (de 1 a 99); j es la posición que ocupa el centil dentro de los
valores ordenados; i es la posición entera inmediatamente anterior; xi es el valor que ocupa la
posición i en la variable ordenada; y xi+1 es el valor que ocupa la posición i + 1 en la variable
ordenada.
• Así los pasos a seguir son:
1. Ordenar los datos de la variable en la muestra;
2. buscar la posición j del centil de interés y
3. aplicar la fórmula anterior de la interpolación lineal.
• Existen otros algoritmos de cálculo de los centiles, por lo que dependiendo del software
utilizado el valor concreto para un determinado cuantil puede variar ligeramente. Por
ejemplo, en la instalación base de R hay 9 algoritmos distintos.
• Los denominados Valores Letra utilizados en el Análisis Exploratorio de Datos se basan en
ir dividiendo por dos los segmentos extremos de la distribución ordenada mediante los
valores que ocuparían la posición a la “profundidad” adecuada.
• Los valores letra también son conocidos como Percentiles de Tukey. Se pueden generar
tantos valores letra como segmentaciones realicemos. La Mediana (Md), los Cuartos (Fi y Fs
) también denominados “hinges” (bisagras) por Tukey, los Octavos (Ei y Es ), los Dieciseisavos
(Di y Ds ) y así sucesivamente.
• Para determinar la profundidad (depth) o posición que ocupan los Valores Letra dentro de
la variable ordenada utilizamos las siguientes expresiones:
20= nº de individuos
21= n+1
J=4,2
Hemos encontrado la j que es una posición,
teneos que encontrar la i que es la posición
entera inmediatamente anterior. Por lo tanto
si la j = 4,2 la i= 4
Con la j y la i podemos encontrar C20 (cetil 20) =3,2
X= posición
pudiéndose generar el MidF , MidE , ..., incluso el denominado MidR si utilizamos el máximo
y mínimo valor de los datos.
• La Trimedia, promedio de la mediana y los Valores Letra cuartos, ponderando la
Mediana con doble peso:
• El Rango Medio se define como el dato que estaría a mitad del recorrido del dato
con el menor valor al dato con el mayor valor.
• El índice MAD, ha sido definido por Tukey como la Mediana de las Desviaciones
Absolutas respecto a la Mediana de los valores iniciales (lo que se alejan en mediana
las puntuaciones de la variable respecto a la mediana sin tener en cuenta si el
alejamiento es en sentido positivo o negativo).
• Coeficiente K3 :
Diagramas de caja:
• Mediante este gráfico, utilizado en el Análisis Exploratorio de Datos, se pueden evaluar
diferentes características de interés ubicadas en la misma gráfica:
• Permite evaluar la tendencia central ubicando la Mediana.
• Nos identifica diferentes ubicaciones relevantes (mediante los cuartos, Fi y Fs).
• Nos informa del grado de dispersión con respecto al centro de la variable (50
% central de las
observaciones) y en las colas (el 25 % de las observaciones ubicada en cada uno
de los extremos).
• Identifica tanto para el centro como para las colas de la distribución, si la
distribución es o no simétrica y, caso de existir, el tipo de asimetría (nos indica
si ésta es positiva o negativa).
• Adicionalmente permite detectar posibles valores anómalos (outliers),
identificándolos como anomalías moderadas o anomalías extremas.
• Media Armónica: Vendría definida por H que representa el inverso de la media aritmética de
los valores observados. Es útil para describir la variable original en aquellas situaciones en que
al no ser su distribución simétrica, la hemos transformado utilizando el inverso.
• Desviación media:
• Coeficiente de Fisher:
2. Índices de apuntamiento
• Coeficiente de Pearson: El coeficiente de Pearson toma el valor 3 para variables mesocúrticas.
Valores superiores indican una distribución Leptocúrtica y valores inferiores una distribución
platicúrtica.
• Coeficiente de Fisher: El coeficiente de Fisher no supone más que la traslación del coeficiente
de Pearson para que la mesocurtosis venga indicada por el valor 0.