C 08 Apuescalas
C 08 Apuescalas
C 08 Apuescalas
A partir de las frecuencias absolutas se pueden calcular las Frecuencias relativas (h=f/n). Estas expresan el tanto por uno que es cada nivel de escala respecto al total n de datos (ver h en cuadros 1 y 2) y que corrientemente se expresan en tanto por ciento (%= h 100) (ver % en cuadros 1 y 2). La suma de estas frecuencias es igual a 1 o a 100, segn sea el caso. Si los niveles de la escala de clasificacin no son excluyentes hay dos bases para el clculo de porcentajes: el total de datos o el total de unidades (ver % y %T en cuadro 1). CUADRO 1. Motivo de consulta de 225 pacientes. Via del Mar.1996. Motivo f h % % T (*) Patologa respiratoria 180 0,800 80,0 30,9 Trastornos digestivos 167 0,742 74,2 28,7 Problemas psicolgicos 17 0,075 7,5 2,9 Problemas gineco- obsttricos 112 0,498 49,8 19,2 Otros trastornos de salud 106 0,471 47,1 18,2 (*) porcentajes usando como base el total de motivos de consulta y no el total de pacientes. Cuando la escala de clasificacin es a intervalos, adems de las frecuencias anteriores se pueden calcular densidades. Una densidad (d) se obtiene dividiendo la frecuencia absoluta entre la amplitud de cada intervalo (d = f /a) y se interpreta como concentracin de los datos en un intervalo, es decir, el nmero de datos por cada unidad de medida en ese nivel de escala. Esta medida es especialmente til cuando los intervalos de una escala tienen amplitudes distintas, pues entonces entrega informacin diferente a la frecuencia absoluta. Por ejemplo, en cuadro 2, entre 15 y 20 aos se observ la mayor concentracin de datos, pues su densidad (5,5 pacientes por ao) es la mayor, en tanto que la mayor cantidad de datos se observ entre 31 y 50 aos (frecuencia absoluta = 77). CUADRO 2. Edad de 225 pacientes de una clnica. Via del Mar. 1996. Edad (aos) N F h H % a 10 - 14 20 20 0,089 0,089 8,9 15-10= 5 15 - 20 33 53 0,147 0,236 14,7 21-15= 6 21 - 30 42 95 0,187 0,423 18,7 31-21=10 31 - 50 77 172 0,342 0,765 34,2 51-31=20 51 - 60 32 204 0,142 0,907 14,2 61-51=10 Mayor de 60 21 225 0,093 1,000 9,3 76-61=15* 225 1,000 100,0 d 4,0 5,5 4,2 3,85 3,2 1,4
Clasificacin tallo-hoja (stem and leaf). Es una forma de clasificacin de datos relativos a una variable cuantitativa, que consiste en usar como niveles de escala (el tallo) los primeros dgitos de los valores de la variable y clasificar los datos (hojas) segn la pertenencia de sus primeros dgitos a cada nivel. Generalmente se usa antes de arribar a una clasificacin definitiva de datos contnuos. Ejemplo, si se tuviera los datos de estatura (en cm) de los 42 adultos siguientes: 170 172 180 165 172 176 168 170 173 159 164 160 164 172 158 162 161 167 171 164 170 169 184 165 171 182 169 176 166 177 171 168 172 170 168 162 169 166 160 158 173 167
Usando como tallo los dos primeros dgitos de la estatura, la clasificacin sera como sigue: 15 | 8 8 9 16 | 0 0 1 2 2 4 4 4 5 5 6 6 7 7 8 8 8 9 9 9 17 | 0 0 0 0 1 1 1 2 2 2 2 3 3 6 6 7 18 | 0 2 4 El tallo puede afinar ms sus niveles, por ejemplo, cada 5 cm: 155 | 8 8 9 160 | 0 0 1 2 2 4 4 4 165 | 5 5 6 6 7 7 8 8 8 9 9 9 170 | 0 0 0 0 1 1 1 2 2 2 2 3 3 175 | 6 6 7 180 | 0 2 4 Se puede usar esta clasificacin como base para efectuar fcilmente la clasificacin definitiva segn una escala a intervalos de cualquier amplitud.
CLASIFICACIN BIVARIADA. Se refiere a la clasificacin de un grupo de datos, de acuerdo a dos escalas simultneamente, correspondiendo cada escala a una variable diferente. Esta clasificacin se hace cuando el objetivo es establecer si ambas variables se encuentran asociadas entre si. Como resultado se obtiene una tabla en la que se distingue un cuerpo formado por frecuencias absolutas bivariadas y tres tipos de totales marginales: totales fila, totales columna y total general (Cuadro 3).
Estado fsico Normal Superior N % N % 11 50,0 2 9,1 44 81,5 3 5,5 6 46,1 5 38,5 61 68,5 10 11,2
22 54 13 89
Cada total fila o columna representa la suma de frecuencias de una distribucin univariada tomada del cuerpo de la tabla en tanto el total general, representa la suma de frecuencias de todos los totales fila o columna. Por haber estos 3 tipos de totales, podran calcularse 3 tipos de frecuencias relativas y por tanto, 3 tipos de porcentajes. Sin embargo, a la hora de presentar resultados, se elige slo uno de esos tres tipos de totales, para usarlo como base de porcentajes. Como para un estudio de asociacin interesa mostrar diferencias entre las distribuciones del cuerpo de la tabla, se suele descartar el total general y elegir la base para porcentajes entre los dos totales restantes: si se desea comparar las distribuciones entre los niveles fila, se debe usar como base los totales fila y si se desea comparar las distribuciones entre los niveles columna, se debe usar como base los totales columna. En cuadro 3 se ve que la intencin fue comparar los niveles socioeconmicos entre si, pues se calcul porcentajes sobre esos totales (totales fila). De este modo los totales fila, que eran muy diferentes, se igualaron a 100 y permiten una comparacin entre sus perfiles de estado fsico. Si esos perfiles son iguales, se concluye que no hay asociacin entre ambas variables, pero si difieren habr algn grado de asociacin, mas alto mientras mas difieran. En cuadro 3 se observa diferencia entre las 3 distribuciones (perfiles) de porcentajes de nivel socioeconmico, por lo que se puede concluir que hay algn grado de asociacin entre esa variable y estado fsico. En la clasificacin de Estado nutricional por Edad mostrada en cuadro 4, caso A, las distribuciones de porcentajes son similares, por lo que suponemos que all no hay una asociacin presente; en cambio, en el caso B difieren bastante, por lo que concluimos una asociacin fuerte all CUADRO 4. ESTADO NUTRICIONAL SEGN EDAD, EN DOS GRUPOS DE NIOS.
Estado Nutricional Eutrfico DN leve DN grave Caso A Edad (aos) 1 y menos 2 a 5 6a8 54,3 57,8 54,4 30,0 29,8 31,5 15,7 12,4 14,1 100 100 100 Caso B Edad (aos) 1 y menos 2 a 5 6a8 32,7 41,0 14,8 49,1 47,8 28,7 18,2 11,2 56,5 . 100 100 100
La asociacin observada en una tabla, no debe interpretarse necesariamente como dependencia entre las 2 variables implicadas, porque esa asociacin pudiera ser reflejo de la dependencia de otras variables no consideradas en la clasificacin. Ejemplo: la asociacin observada en Cuadro 4 caso B, podra deberse a que el estado nutricional se deteriora al disminuir el nmero de controles en nios de mayor edad y no a la mayor edad de ellos, entonces la edad sera interferente en la asociacin entre nmero de controles y estado nutricional. Debe evitarse efectuar clasificaciones bivariadas entre variables a escala de intervalos pues pueden manipularse las amplitudes de estos para encontrar o no asociacin. Por ejemplo, al comparar lo que ocurre entre las situaciones A y B de cuadro 5, se observa que, pese a tratarse de los mismos datos, en A se observa una asociacin clara entre FEF y talla en tanto que en B, no hay tal asociacin. La diferencia se debe a que se consideraron intervalos distintos de la variable Talla en las dos situaciones. Solo debieran aceptarse clasificaciones bivariadas entre variables a intervalos, cuando sobre estos intervalos se ha consensuado previamente. CUADRO 5. VALORES DE FEF25-75 SEGN TALLA DE PIE, EN 85 ADULTOS. Situacin A Situacin B Talla (cm) Talla (cm) FEF < 154 154 <150 150 N % N % . N % N % . < 3,18 15 28,3 30 93,8 2 6,7 12 21,8 3,18 38 71,7 2 6,2 28 93,3 43 78,2
CLASIFICACIN TRIVARIADA Se refiere a la clasificacin simultnea de los datos, de acuerdo a tres escalas de clasificacin, para establecer si esas variables se encuentran asociadas entre s. Estas clasificaciones son poco usadas porque generalmente son difciles de interpretar o requieren mtodos de anlisis complejos. Sin embargo, se las puede analizar haciendo una clasificacin bivariada entre dos de ellas, para cada nivel de la tercera escala y concluir acerca de la interferencia de esa tercera variable en la asociacin entre las dos primeras. Esto es llamado corrientemente anlisis estratificado.
Por ejemplo, en Cuadro 6 se muestra la clasificacin bivariada de nivel socioeconmico (NSE) segn estado fsico, para cada sexo de un grupo de adultos. El sexo es llamada aqu variable de estratificacin pues se investiga su interferencia en la asociacin entre las dos primeras. En sexo masculino se ve que mientras aumenta el nivel socioeconmico mejora el estado fsico pero esta asociacin no se observa en sexo femenino. Ello indicara que sexo es variable interferente en la asociacin entre las otras dos. Por otra parte, hay que tener en cuenta que en clasificaciones a ms de dos escalas, las frecuencias tendern a ser ms reducidas pues aumenta el nmero de celdas, impidiendo o dificultando muchas veces arribar a conclusiones valederas acerca de asociaciones. Esto suele acontecer cuando los niveles de las escalas que se hayan usado en la clasificacin son muchos en relacin al nmero de datos clasificados. Por ejemplo, en cuadro 6, para sexo masculino, el NSE alto tiene un total muy bajo en relacin a los dems (solo 5 casos) y en sexo femenino, acontece lo mismo con estado fsico superior (hay solo 3 casos). Una solucin posible a este problema se encuentra consolidando niveles de forma razonable. Por ejemplo, en sexo masculino considerar NSE Medio + Bajo y en sexo femenino, Estado fsico Normal + Superior. En general, cuando hay totales marginales muy pequeos en una direccin, debe evitarse la presentacin de porcentajes usando esos totales como base, pues esos porcentajes representarn nada de inters. Es el caso de cuadro 6, si se quiere usar como total para porcentajes el de estado fsico superior o el de nivel socioeconmico alto. Los porcentajes que resulten informarn una tendencia no confiable. CUADRO 6. Nivel socioeconmico segn estado fsico en cada sexo de 89 adultos. Masculino Femenino Estado fsico Estado fsico NSE Deficiente Normal Superior Deficiente Normal Superior N % N % N % N % N % N % Bajo 4 57,1 3 42,0 0 0 5 33,3 8 53,3 2 13,3 Medio 5 21,7 15 65,2 3 13,0 2 6,4 29 93,5 0 0 Alto 0 0 1 20,0 4 80,0 2 25,0 5 62,5 1 12,5