Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

C 08 Apuescalas

Descargar como doc, pdf o txt
Descargar como doc, pdf o txt
Está en la página 1de 4

SALUD Y SOCIEDAD

ESCALAS Y CLASIFICACION DE DATOS.


ESCALAS DE CLASIFICACIN. La primera forma de sntesis de datos se logra clasificando estos de acuerdo a una escala (clasificacin univariada) o a ms escalas (clasificacin multivariada). Clasificar consiste en ordenar los datos colectados segn los niveles de una escala de clasificacin preparada de antemano. Esta escala es un conjunto de niveles correspondientes a los datos de una variable, que pueden ser atributos cualitativos, valores o intervalos de valores. Si la variable es cualitativa, los niveles de su escala de clasificacin son generalmente los mismos atributos usados para definir la variable, es decir, los mismos datos colectados; por ejemplo, la variable Sintomatologa, puede haberse colectado con datos tales como: tos, disuria, incontinencia, apremio, espasmo, dolor, otro que sern los mismos a usar como niveles de escala. Para una variable cuantitativa discreta, los niveles pueden ser los datos enteros que genera o intervalos de esos datos, por ejemplo, Paridad se manifiesta con datos tales como "0", "1", "2",... etc. partos, que pueden ser los niveles de la escala; pero tambin esos niveles podran ser intervalos tales como 0 a 1, 2 a 3, etc. partos. Para una variable continua en cambio, los niveles sern siempre intervalos de valores, que pueden ser fijados segn los deseos del investigador o generados segn el rango de datos observados. En el primer caso, los intervalos pueden tener amplitudes diferentes pero en el segundo, las amplitudes de estos sern siempre iguales. Para hacer una escala a intervalos de igual amplitud, se debe calcular primero la diferencia entre el dato mximo y el dato mnimo colectados y dividir esa diferencia entre el nmero de intervalos que se desea, buscando siempre un equilibrio entre el nmero de datos colectados y la discriminacin que se desea, ya que si los datos son poco numerosos, no tiene objeto pensar en un gran nmero de intervalos porque algunos de ellos pueden quedar vacos y, si los datos son suficientes y se desea una alta discriminacin, debe aumentarse el nmero de intervalos. Una vez calculada la amplitud, que simbolizaremos por a, se generan los niveles de la escala. Una opcin es iniciar el primer nivel con el dato mnimo y a este sumarle a sucesivamente, hasta cubrir el dato mximo. Por ejemplo: Al colectar datos de peso en una muestra de recin nacidos, se obtuvo un mximo de 4,08 Kg y un mnimo de 1,96 Kg. Para una escala a 4 intervalos, de amplitud igual, esa amplitud debe ser a =(4,08-1,96) /4= 0,53 Kg. Luego, para generar la escala, se puede sumar sucesivamente la amplitud a partir del dato mnimo, obtenindose: 1,96 - 2,49 - 3,02 - 3,55 - 4,08 Los niveles de una escala son mutuamente excluyentes si una misma unidad no puede originar datos para ms de un nivel de esa escala. Por ejemplo, los niveles de la escala de sexo son mutuamente excluyentes, porque un mismo adulto originar el dato masculino o el femenino pero nunca ambos. En cambio, uno de los 225 pacientes del cuadro 1, pudo originar datos para ms de un nivel de la variable Motivo de consulta, por ejemplo: patologa respiratoria y Trastorno digestivo. Al construir una escala para una variable cuyos niveles son intervalos de valores, se debe cautelar que estos sean mutuamente excluyentes. En la escala para peso de recin nacidos del prrafo anterior, se puede aumentar en una centsima el extremo inferior de cada intervalo para hacerlos excluyentes. En una escala a intervalos habr que cuidar de indicar y respetar siempre el nivel de precisin con que se efectu la medicin, agregando los decimales necesarios para ello. Por ejemplo, los niveles (intervalos) de la escala para peso construida antes, muestra que el nivel de precisin de la medicin alcanza a dos decimales. Para hacer exhaustiva una escala, se suele agregar a ella el nivel otra ( cuadro 1) o los niveles menor que... o mayor que... (cuadro 2). Preparadas las escalas necesarias, se efecta la clasificacin de los datos. Como resultado se ver que estos quedan distribuidos segn los niveles de su escala, en lo que llamaremos una distribucin de los datos. Una clasificacin de datos puede efectuarse de acuerdo a una escala, clasificacin univariada; a dos escalas, clasificacin bivariada; a tres escalas, clasificacin trivariada o a mas escalas. En general, cuando se trata de clasificacin a ms de una escala, se la llama clasificacin multivariada. CLASIFICACIN UNIVARIADA. Generalmente, el anlisis de datos se inicia efectuando clasificaciones univariadas para cada variable del estudio. Estas clasificaciones permiten conocer la distribucin, estructura o perfil del grupo estudiado segn cada variable y muchas veces detectar errores en los datos. Por ejemplo, la estructura (el perfil) de edad de cierta poblacin que se muestra en cuadro 2 y la estructura del motivo de consulta de esa poblacin que se muestra en cuadro 1. Como resultado inmediato de la clasificacin, se obtiene los nmeros de datos por cada nivel, o frecuencias absolutas (f) univariadas. La suma de estas frecuencias debe ser igual al total de datos colectados, que no siempre es igual al nmero de unidades proveedoras de esos datos. Ambos totales coincidirn solo si los niveles de la escala de clasificacin son mutuamente excluyentes (cuadro 2), pero no coincidirn si no son excluyentes (en cuadro 1 las unidades son 225 en tanto que los datos registrados acerca de motivos de consulta son 582).

A partir de las frecuencias absolutas se pueden calcular las Frecuencias relativas (h=f/n). Estas expresan el tanto por uno que es cada nivel de escala respecto al total n de datos (ver h en cuadros 1 y 2) y que corrientemente se expresan en tanto por ciento (%= h 100) (ver % en cuadros 1 y 2). La suma de estas frecuencias es igual a 1 o a 100, segn sea el caso. Si los niveles de la escala de clasificacin no son excluyentes hay dos bases para el clculo de porcentajes: el total de datos o el total de unidades (ver % y %T en cuadro 1). CUADRO 1. Motivo de consulta de 225 pacientes. Via del Mar.1996. Motivo f h % % T (*) Patologa respiratoria 180 0,800 80,0 30,9 Trastornos digestivos 167 0,742 74,2 28,7 Problemas psicolgicos 17 0,075 7,5 2,9 Problemas gineco- obsttricos 112 0,498 49,8 19,2 Otros trastornos de salud 106 0,471 47,1 18,2 (*) porcentajes usando como base el total de motivos de consulta y no el total de pacientes. Cuando la escala de clasificacin es a intervalos, adems de las frecuencias anteriores se pueden calcular densidades. Una densidad (d) se obtiene dividiendo la frecuencia absoluta entre la amplitud de cada intervalo (d = f /a) y se interpreta como concentracin de los datos en un intervalo, es decir, el nmero de datos por cada unidad de medida en ese nivel de escala. Esta medida es especialmente til cuando los intervalos de una escala tienen amplitudes distintas, pues entonces entrega informacin diferente a la frecuencia absoluta. Por ejemplo, en cuadro 2, entre 15 y 20 aos se observ la mayor concentracin de datos, pues su densidad (5,5 pacientes por ao) es la mayor, en tanto que la mayor cantidad de datos se observ entre 31 y 50 aos (frecuencia absoluta = 77). CUADRO 2. Edad de 225 pacientes de una clnica. Via del Mar. 1996. Edad (aos) N F h H % a 10 - 14 20 20 0,089 0,089 8,9 15-10= 5 15 - 20 33 53 0,147 0,236 14,7 21-15= 6 21 - 30 42 95 0,187 0,423 18,7 31-21=10 31 - 50 77 172 0,342 0,765 34,2 51-31=20 51 - 60 32 204 0,142 0,907 14,2 61-51=10 Mayor de 60 21 225 0,093 1,000 9,3 76-61=15* 225 1,000 100,0 d 4,0 5,5 4,2 3,85 3,2 1,4

Clasificacin tallo-hoja (stem and leaf). Es una forma de clasificacin de datos relativos a una variable cuantitativa, que consiste en usar como niveles de escala (el tallo) los primeros dgitos de los valores de la variable y clasificar los datos (hojas) segn la pertenencia de sus primeros dgitos a cada nivel. Generalmente se usa antes de arribar a una clasificacin definitiva de datos contnuos. Ejemplo, si se tuviera los datos de estatura (en cm) de los 42 adultos siguientes: 170 172 180 165 172 176 168 170 173 159 164 160 164 172 158 162 161 167 171 164 170 169 184 165 171 182 169 176 166 177 171 168 172 170 168 162 169 166 160 158 173 167

Usando como tallo los dos primeros dgitos de la estatura, la clasificacin sera como sigue: 15 | 8 8 9 16 | 0 0 1 2 2 4 4 4 5 5 6 6 7 7 8 8 8 9 9 9 17 | 0 0 0 0 1 1 1 2 2 2 2 3 3 6 6 7 18 | 0 2 4 El tallo puede afinar ms sus niveles, por ejemplo, cada 5 cm: 155 | 8 8 9 160 | 0 0 1 2 2 4 4 4 165 | 5 5 6 6 7 7 8 8 8 9 9 9 170 | 0 0 0 0 1 1 1 2 2 2 2 3 3 175 | 6 6 7 180 | 0 2 4 Se puede usar esta clasificacin como base para efectuar fcilmente la clasificacin definitiva segn una escala a intervalos de cualquier amplitud.

CLASIFICACIN BIVARIADA. Se refiere a la clasificacin de un grupo de datos, de acuerdo a dos escalas simultneamente, correspondiendo cada escala a una variable diferente. Esta clasificacin se hace cuando el objetivo es establecer si ambas variables se encuentran asociadas entre si. Como resultado se obtiene una tabla en la que se distingue un cuerpo formado por frecuencias absolutas bivariadas y tres tipos de totales marginales: totales fila, totales columna y total general (Cuadro 3).

CUADRO 3. ESTADO FISICO SEGN NIVEL SOCIOECONOMICO.

NSE Bajo Medio Alto Total

Deficiente N % 9 40,9 7 13,0 2 15,4 18 20,2

Estado fsico Normal Superior N % N % 11 50,0 2 9,1 44 81,5 3 5,5 6 46,1 5 38,5 61 68,5 10 11,2

22 54 13 89

Total 100 100 100

Cada total fila o columna representa la suma de frecuencias de una distribucin univariada tomada del cuerpo de la tabla en tanto el total general, representa la suma de frecuencias de todos los totales fila o columna. Por haber estos 3 tipos de totales, podran calcularse 3 tipos de frecuencias relativas y por tanto, 3 tipos de porcentajes. Sin embargo, a la hora de presentar resultados, se elige slo uno de esos tres tipos de totales, para usarlo como base de porcentajes. Como para un estudio de asociacin interesa mostrar diferencias entre las distribuciones del cuerpo de la tabla, se suele descartar el total general y elegir la base para porcentajes entre los dos totales restantes: si se desea comparar las distribuciones entre los niveles fila, se debe usar como base los totales fila y si se desea comparar las distribuciones entre los niveles columna, se debe usar como base los totales columna. En cuadro 3 se ve que la intencin fue comparar los niveles socioeconmicos entre si, pues se calcul porcentajes sobre esos totales (totales fila). De este modo los totales fila, que eran muy diferentes, se igualaron a 100 y permiten una comparacin entre sus perfiles de estado fsico. Si esos perfiles son iguales, se concluye que no hay asociacin entre ambas variables, pero si difieren habr algn grado de asociacin, mas alto mientras mas difieran. En cuadro 3 se observa diferencia entre las 3 distribuciones (perfiles) de porcentajes de nivel socioeconmico, por lo que se puede concluir que hay algn grado de asociacin entre esa variable y estado fsico. En la clasificacin de Estado nutricional por Edad mostrada en cuadro 4, caso A, las distribuciones de porcentajes son similares, por lo que suponemos que all no hay una asociacin presente; en cambio, en el caso B difieren bastante, por lo que concluimos una asociacin fuerte all CUADRO 4. ESTADO NUTRICIONAL SEGN EDAD, EN DOS GRUPOS DE NIOS.
Estado Nutricional Eutrfico DN leve DN grave Caso A Edad (aos) 1 y menos 2 a 5 6a8 54,3 57,8 54,4 30,0 29,8 31,5 15,7 12,4 14,1 100 100 100 Caso B Edad (aos) 1 y menos 2 a 5 6a8 32,7 41,0 14,8 49,1 47,8 28,7 18,2 11,2 56,5 . 100 100 100

La asociacin observada en una tabla, no debe interpretarse necesariamente como dependencia entre las 2 variables implicadas, porque esa asociacin pudiera ser reflejo de la dependencia de otras variables no consideradas en la clasificacin. Ejemplo: la asociacin observada en Cuadro 4 caso B, podra deberse a que el estado nutricional se deteriora al disminuir el nmero de controles en nios de mayor edad y no a la mayor edad de ellos, entonces la edad sera interferente en la asociacin entre nmero de controles y estado nutricional. Debe evitarse efectuar clasificaciones bivariadas entre variables a escala de intervalos pues pueden manipularse las amplitudes de estos para encontrar o no asociacin. Por ejemplo, al comparar lo que ocurre entre las situaciones A y B de cuadro 5, se observa que, pese a tratarse de los mismos datos, en A se observa una asociacin clara entre FEF y talla en tanto que en B, no hay tal asociacin. La diferencia se debe a que se consideraron intervalos distintos de la variable Talla en las dos situaciones. Solo debieran aceptarse clasificaciones bivariadas entre variables a intervalos, cuando sobre estos intervalos se ha consensuado previamente. CUADRO 5. VALORES DE FEF25-75 SEGN TALLA DE PIE, EN 85 ADULTOS. Situacin A Situacin B Talla (cm) Talla (cm) FEF < 154 154 <150 150 N % N % . N % N % . < 3,18 15 28,3 30 93,8 2 6,7 12 21,8 3,18 38 71,7 2 6,2 28 93,3 43 78,2

CLASIFICACIN TRIVARIADA Se refiere a la clasificacin simultnea de los datos, de acuerdo a tres escalas de clasificacin, para establecer si esas variables se encuentran asociadas entre s. Estas clasificaciones son poco usadas porque generalmente son difciles de interpretar o requieren mtodos de anlisis complejos. Sin embargo, se las puede analizar haciendo una clasificacin bivariada entre dos de ellas, para cada nivel de la tercera escala y concluir acerca de la interferencia de esa tercera variable en la asociacin entre las dos primeras. Esto es llamado corrientemente anlisis estratificado.

Por ejemplo, en Cuadro 6 se muestra la clasificacin bivariada de nivel socioeconmico (NSE) segn estado fsico, para cada sexo de un grupo de adultos. El sexo es llamada aqu variable de estratificacin pues se investiga su interferencia en la asociacin entre las dos primeras. En sexo masculino se ve que mientras aumenta el nivel socioeconmico mejora el estado fsico pero esta asociacin no se observa en sexo femenino. Ello indicara que sexo es variable interferente en la asociacin entre las otras dos. Por otra parte, hay que tener en cuenta que en clasificaciones a ms de dos escalas, las frecuencias tendern a ser ms reducidas pues aumenta el nmero de celdas, impidiendo o dificultando muchas veces arribar a conclusiones valederas acerca de asociaciones. Esto suele acontecer cuando los niveles de las escalas que se hayan usado en la clasificacin son muchos en relacin al nmero de datos clasificados. Por ejemplo, en cuadro 6, para sexo masculino, el NSE alto tiene un total muy bajo en relacin a los dems (solo 5 casos) y en sexo femenino, acontece lo mismo con estado fsico superior (hay solo 3 casos). Una solucin posible a este problema se encuentra consolidando niveles de forma razonable. Por ejemplo, en sexo masculino considerar NSE Medio + Bajo y en sexo femenino, Estado fsico Normal + Superior. En general, cuando hay totales marginales muy pequeos en una direccin, debe evitarse la presentacin de porcentajes usando esos totales como base, pues esos porcentajes representarn nada de inters. Es el caso de cuadro 6, si se quiere usar como total para porcentajes el de estado fsico superior o el de nivel socioeconmico alto. Los porcentajes que resulten informarn una tendencia no confiable. CUADRO 6. Nivel socioeconmico segn estado fsico en cada sexo de 89 adultos. Masculino Femenino Estado fsico Estado fsico NSE Deficiente Normal Superior Deficiente Normal Superior N % N % N % N % N % N % Bajo 4 57,1 3 42,0 0 0 5 33,3 8 53,3 2 13,3 Medio 5 21,7 15 65,2 3 13,0 2 6,4 29 93,5 0 0 Alto 0 0 1 20,0 4 80,0 2 25,0 5 62,5 1 12,5

También podría gustarte