Curso Básico de Psicometría

Curso Bsico de Psicometra
La evaluacin Psicolgica y el mbito de aplicacin La evaluacin psicolgica es un proceso de toma de decisiones ya que el propsito ltimo es recomendar un camino de accin determinado en virtud de los objetivos perseguidos por la evaluacin. El psiclogo en este aspecto no es el que toma una decisin, sino que se realiza una recomendacin a partir del proceso que implica la toma de la evaluacin. Debe quedar claro que este proceso se caracteriza como una instancia consultiva, no decisoria, pero que a la larga implica una toma de decisin por otras personas distintas al evaluador. La evaluacin psicolgica puede ser aplicada en diferentes mbitos: mbito Forense; en este caso, ser el juez quien decida el curso de la accin a seguir en virtud de las recomendaciones que realiza el psiclogo mediante el Informe Psicolgico. El juez solicita al psiclogo algunos puntos de pericia para determinar si un sujeto es capaz de comprender la criminalidad de sus actos al momento de cometer el delito, o si alguien que haba sido vctima de un accidente de trnsito se evaluar el trastorno por estrs post traumtico. Con dicho informe el magistrado podr tomar una decisin concreta teniendo en cuenta los lo reportado en los puntos periciales evaluados en el proceso psicodiagnstico. mbito Educativo; quien solicite esta evaluacin podr ser un maestro, un director de escuela, un pap, una mam entre otros actores posibles. Y el motivo podra estar relacionado con disfunciones en el aprendizaje, trastornos en el comportamiento dentro de la escuela, dificultades en la integracin de los grupos de pares o docentes, entre otros. El psiclogo evaluador se unir toda la evidencia posible que lo lleve a poder formular un diagnstico de la situacin y una o varias recomendaciones alternativas dirigidas a solucionar o mejorar la dificultad que motiva la evaluacin, o a describir y recomendar intervenciones o programas acordes con los talentos o habilidades especiales detectadas. Luego sern esos diferentes actores involucrados los que debern adoptar o no la decisin a seguir segn las recomendaciones del psiclogo evaluador. mbito Laboral; El psiclogo es convocado para efectuar una recomendacin, en relacin con la promocin o seleccin de un candidato entre varios potenciales, o la deteccin de reas de vacancia que deben fortalecerse en un grupo de trabajo determinado para disear un plan de capacitaciones especfico. El psiclogo en este caso dar su opinin en relacin a las evaluaciones psicodiagnsticas, pero ser la empresa contratante la que tomar la ltima decisin de optar o no por las recomendaciones realizadas por el evaluador. mbito Clnico; Para algunos autores el proceso de evaluacin psicolgica se asimila al nombre de psicodiagnstico. El motivo de consulta est gatillado por algn malestar, sufrimiento, disfuncin, sintomatologa o por algn grado de invalidez constatado en el individuo, pareja familia o grupo. Con este motivo de consulta inicial, el
evaluador recoger toda la informacin posible vinculada al tema a tratar, de manera de poder identificar algunas recomendaciones, dirigidas a mejorar la situacin presente. Pero ser el propio evaluado y /o sus allegados quienes decidirn, concretamente, si seguirn las indicaciones dadas por el psiclogo. Y ms all de la visin tradicional, est tomando mucha relevancia el enfoque del paradigma positivista, que propone destacar y enfatizar los factores protectores con que las personas cuentan, perdindose de vista los aspectos disfuncionales, y resaltando los generadores de salud. Esto implica un nivel de anlisis personal, grupal y social. Evaluacin de Programas; Es otro mbito de aplicacin y se refiere al rea de trabajo en la que el psiclogo intenta determinar la eficacia de una intervencin, tratamiento o programa, por ejemplo la eficacia que ha tenido una campaa dirigida a modificar las actitudes hacia la integracin de personas con capacidades diferentes, o cambiar los comportamientos referidos al uso del preservativo en los individuos sexualmente activos, etc. En todos estos casos se habla de una intervencin, programa o tratamiento orientado a cambiar ciertas circunstancias que se desea alterar, y para ello debe efectuarse, al menos una evaluacin de la situacin antes de aplicar el programa, y otra despus de haberlo concluido, con miras a determinar si eso result eficaz, en trminos de lograr la modificacin pretendida y en los sentidos esperados. Esta disciplina se ejerce en el mbito de la investigacin, ms especficamente en los contextos de descubrimiento y de justificacin. La evaluacin psicolgica implica una instancia consultiva, en la que el psiclogo ser convocado para reunir toda la informacin o indicadores disponibles referidos a un problema, a una pregunta o a un tema dado, y en base a ello efectuar una o varias recomendaciones dirigidas a resolver o mejorar el problema o responder el interrogante aun sin resolucin, en la que la decisin estar en manos de otra persona- quien ha solicitado la evaluacin-. Se entiende por mbito de aplicacin de la psicologa y de la Evaluacin Psicolgica, aquellos contextos en los que puede desempearse el psiclogo, ejerciendo su rol profesional, aplicando conocimientos tcnicos que derivan de teoras y de investigaciones empricas. Por otro lado definimos como mbito de investigacin al contexto en el que la Psicologa se desarrolla como disciplina cientfica, generando nuevos conocimientos en forma permanente, los cuales sern transferidos, mediata o inmediatamente, al mbito de aplicacin. De all que hay un permanente interjuego entre el mbito de aplicacin y de investigacin de la psicologa, y ms especficamente el de la evaluacin psicolgica. Por lo tanto se podra decir que la Evaluacin Psicolgica es una tarea de la psicologa aplicada dirigida a la solucin de problemas personales, institucionales, grupales, comunitarios, sociales o ambientales. Y para desarrollar esta actividad resulta necesaria la aplicacin de un modelo terico que ser de utilidad para comprender o analizar el fenmeno concreto que es el objeto de nuestra atencin. Ello significa que entre las tareas implicadas en la evaluacin psicolgica se encuentran la categorizacin, comprensin, el Anlisis y la contrastacin de los datos referidos a los atributos del sujeto y/o de la situacin o interaccin que se est analizando.
El psiclogo evaluador podr posicionarse en diversos modelos tericos alternativos para interpretar el fenmeno que est estudiando o analizando, no existiendo un nico marco terico que sustente las conclusiones. Al respecto hay que mencionar que existen 3 tipos de modelos tericos alternativos en los que podemos basarnos: Los centrados en el sujeto; En estos modelos podemos ubicar al modelo mdicopsiquitrico, el psicoanaltico, o el de rasgos o atributos, y el fenomenolgico, entre los ms importantes. Los que ubican el nfasis en las variables situacionales; En estos encontramos el conductismo radical, los mediacionales y, fundamentalmente aquellos que jerarquizan las la influencia de variables intervinientes. Y los que colocan el acento en las interacciones entre el sujeto y el medio; En esta categora aparecen los modelos interaccinales, de condicionamiento, el estructuralismo cognitivista, el de las representaciones sociales, el estudio del afrontamiento y del procesamiento cognitivo, entre los ms representativos. Es por ello que se puede redefinir el concepto de evaluacin psicolgica como el proceso de toma de decisiones, siendo el objeto de esta rea de trabajo el estudio, anlisis y valoracin de las caractersticas de un sujeto, de sus formas de accin, reaccin e interaccin con los dems y con la realidad y con sus procesos de cambio. Desde esta perspectiva es preciso conceptualizar al individuo o al grupo como integrante de un sistema conformado por sujetos caracterizados como individualidades bio-psicosociales sometidas a procesos internos y externos que afectan y determinan recprocamente los modos de conducta entre el sujeto y la realidad. Y los efectos de los mismos se manifiestan en producciones o comportamientos de tipo fisiolgicos, motriz, emocional y/o cognitivo, en tanto que la totalidad de los factores se ven afectadas por la interaccin recproca. Por lo tanto no se puede pensar a la evaluacin psicolgica como una actividad que se reduce meramente al anlisis de productos o comportamientos separados de otras variables. Se caracteriza la forma de actuar del psiclogo en la tarea de evaluacin como integrada por varios pasos que se pueden dar en un desarrollo simultneo y/o sucesivos; as el especialista en el rea recabar informacin mediante diversas herramientas tcnicas que seleccionar cuidadosamente segn el objetivo de la evaluacin, organizar dicha informacin en un mapa conceptual que contemple la temporalidad y policausalidad de los fenmenos psquicos, formular hiptesis diagnsticas y explicativas acerca de la naturaleza y definicin de los procesos y productos involucrados en la evaluacin, que ir fortaleciendo o descartando segn avance en el anlisis del material recogido y contraste dichas hiptesis con los datos de la realidad, elaborar una sntesis del caso, y efectuar una o varias recomendaciones en trminos de cursos de accin sugeridos, que comunicar mediante una devolucin oral y/o un informe. Finalmente, de ser posible, realizar una evaluacin de control, seguimiento o anlisis de cambio, segn corresponda para validad en la prctica los resultados de la evaluacin. Para llevar a cabo su tarea de evaluacin, el psiclogo especialista recurrir a un arsenal de pruebas que le permitan recoger la informacin necesaria para llevar a cabo este proceso. Se refiere a las tcnicas Psicomtricas, proyectivas y las entrevistas diagnsticas,
que consta de la toma de contacto directo con el entrevistado y sus aspectos particulares, as como el propsito de la evaluacin.
Evaluacin Psicolgica y Psicometra; diferencias e interaccin En el mbito de la investigacin, la principal tarea del psiclogo es la generacin de nuevos conocimientos que sern transmitidos al mbito de aplicacin de la psicologa para la resolucin de problemas concretos. Es entonces que el especialista se desempear como investigador, utilizando las tcnicas de evaluacin psicolgicas como instrumento y recoleccin de datos, orientados a obtener la informacin emprica (proveniente de la realidad) que servir para corroborar o refutar hiptesis de trabajo. Ahora bien, existe otra insercin de psiclogo como investigador, y se refiere al especializarse en el diseo, construccin y adaptacin de tcnicas de evaluacin psicolgica. El investigador se especializar en el rea de la psicometra, donde los test ya no sern un medio para obtener informacin, sino un fin en s mismo. Ellos son, el producto de un desarrollo tecnolgico derivado de un modelo terico y su construccin ser, en s misma, un objetivo de investigacin. Por lo tanto se puede definir a la psicometra como la disciplina que tiene por finalidad el desarrollo de modelos (preferentemente) cuantitativos que permitan transformar o codificar los fenmenos o de los fenmenos o hechos en datos, diseando mtodos adecuados para la aplicacin de tales modelos con el fin de determinar las diferencias individuales de los sujetos en cuanto a sus atributos, sus propiedades o sus rasgos. Es importante destacar que los modelos psicomtricos formulados para explicar o comprender fenmenos, son en general de corte cuantitativo, pero no necesariamente esto es as en todos los casos. Es posible detectar y describir diferencias mediante el uso de conceptos operacionalizados en forma cualitativa, semicuantitativa u ordinal, o directamente cuantitativa. Para ello es necesario recurrir a los NIVELES DE MEDICIN desarrollados por Stevens. La medicin se caracteriza como un proceso de asignacin de nmeros o smbolos a atributos de los objetos, siguiendo una serie de reglas dirigidas a representar la presencia o ausencia del atributo medido, su calidad, jerarqua o cantidad. Conceptualizada de esta forma, una escala se define como un conjunto de nmeros o smbolos cuyas propiedades modelan propiedades empricas de los sujetos a los que esos nmeros o smbolos son asignados. Entonces la medicin se piensa como sinnimo de cuantificacin, pero a su vez en este nivel cuantitativo o mtrico, pueden distinguirse las escalas de intervalos y las escalas de cocientes o razones. Si bien ambas implican la nocin de cuantificacin conservan algunas diferencias. El nivel intervalar ( cuantitativo), supone la igualdad de intervalos entre nmeros; cada unidad de esta escala es exactamente igual a cualquier otra unidad, adems, al igual que en el nivel de medicin ordinal, no existe un punto cero absoluto, sino uno arbitrario (por ejemplo la temperatura expresada en grados, el punto cero de temperatura no indica ausencia del atributo).
Es posible efectuar en este nivel todas las operaciones aritmticas posibles, y por lo tanto, calcular todos los descriptivos previstos por la estadstica, cosa que no sucede en los niveles de medicin ordinal y nominal. Por ejemplo no pueden calcularse la media o promedio de atributos tales como aciertos o errores, sntomas presentes ausentes. El nivel de Medicin de cociente o razones ( cuantitativo) posee todas las caractersticas y facilidades nombradas para el nivel de intervalos, pero su punto cero no es arbitrario sino absoluto. Esto significa que no ha sido convencionalmente establecido, sino que verdaderamente implica ausencia del atributo medido (por ejemplo, la cantidad de hijos, 2, 4 o ninguno). Este nivel de razones implica, al igual que el de intervalos, cuantificacin, o sea, la posibilidad de efectuar todas las operaciones aritmticas y unidades iguales, pero agrega la distincin de poseer un cero absoluto que indica ausencia real del atributo, en tanto que el nivel intervalar es cero es arbitrariamente fijado. El nivel de escalamiento ordinal, jerrquico o semi-cuantitativo se refiere a aquel en que el nmero es utilizado para identificar cada categora, se usa para dar cuenta del ordenamiento o posicin del sujeto en el rasgo medido, sin implicar una unidad de medicin. De esta manera no se conoce la cantidad absoluta del atributo, sino que solamente se puede establecer qu sujetos se ubican en la misma categora, qu otras personas caen en la categora superior o inferior y qu categoras implican ms del atributo que otras (ejemplo, bajo nivel de instruccin, alto nivel de instruccin; escolaridad completa 1 escolaridad incompleta 2, etc.) Entonces este nivel de medicin permite efectuar un ordenamiento de los sujetos sin que sea posible establecer la cantidad absoluta del atributo medido, no implica una cuantificacin sino un ordenamiento, no hay una puntuacin. Este nivel de medicin, junto con el nivel intervalar suponen un establecimiento de un orden y el uso de intervalos, pero la diferencia entre ellos radica en que en el ordinal los intervalos no son necesariamente iguales ni suponen una unidad de medida. El nivel de medicin nominal o cualitativo alude a la presencia o ausencia de un atributo (ejemplo, sntoma presente o ausente). En este tipo de escala solamente se trata de establecer la presencia de un sujeto a una categora en virtud de un atributo dado que la determina, sin implicar una jerarqua entre los individuos. El nmero utilizado para identificar cada categora simplemente nombra o nomina sin indicar un ordenamiento entre los integrantes de esa clase. El hecho de que trabajemos con un nivel de medicin u otro se relacionar con el inters particular del evaluador, con las caractersticas de la variable que se est estudiando, y finalmente, con el tipo de escala al que el instrumento empelado (test) es capaz de llegar. As, en muchos casos es posible medir una misma variable en varios niveles de medicin.
Los Instrumentos Psicomtricos: Dentro del repertorio de pruebas disponibles para el evaluador, se pueden encontrar las tcnicas psicomtricas y las proyectivas, las cuales deben utilizarse en forma conjunta para integrar diferentes aspectos de la persona. Una tcnica, prueba, test, escala o instrumento psicomtrico puede definirse como un dispositivo o procedimiento en el que se obtiene una muestra de comportamiento de un examinado, en un dominio especfico, subsiguientemente evaluado y puntuado, usando procedimientos estandarizados, y que cuente con evidencia emprica sobre la validez y la confiabilidad de los resultados que arroja. Se refiere a un procedimiento que se ha tipificado de manera explcita, puntualizando especficamente un dispositivo o un mtodo de trabajo: Qu tipo de materiales debe utilizarse, qu consignas, qu tems o estmulos, en qu tiempos de administracin se trabajar, si habr o no tiempo lmite, de qu forma se entregar el material, qu actitud asumir el examinador frente al sujeto y frente a las vicisitudes de su desempeo., qu criterios se emplearn para puntuar los resultados, entre otras cuestiones previstas. Este conjunto de procedimientos se ha especificado y estandarizado al memento en que el test ha sido validado y se han calculado sus normas, las cuales deben respetarse en el mbito de la aplicacin. Si se mantiene constante el modo de administracin y puntuacin, entonces tambin se podr inferir que cualquier variacin dada estar determinada por diferencias en los sujetos mismos y no por alteraciones provenientes en el dispositivo de examen o de valoracin del rendimiento. Aqu es necesario tener presente la nocin de encuadre que hemos derivado del psicoanlisis, y que consiste en un propsito explcito de volver constantes ciertas condiciones, por ejemplo el lugar y la duracin de las sesiones, su frecuencia y costos, la regla de asociacin libre, para que el material surgido en estas sesiones sea resultado de contenidos estables o transitorios presentes en cada paciente, y no provenga de alteraciones en las coordenadas de encuadre mismo. Pero no solo los procedimientos se tipifican y se hacen constantes, sino que tambin se realiza lo propio con las formas de puntuacin y con las condiciones de interpretacin de las respuestas brindadas por lo examinados. El examinador debe mantenerse atento desde el primer contacto, y a lo largo de todo el proceso de evaluacin, a las caractersticas personales del evaluado: su edad, su sexo, sus variables de personalidad, su nivel educativo, su pertenencia a determinados grupos y subgrupos culturales, profesionales o religiosos, sus modalidades de contacto con las dems personas, sus limitaciones fsicas si las tuviera, su preferencias e intereses, sus habilidades, sus peculiaridades psquicas y biolgicas, entre otros muchos aspectos. En la toma de test, el examinado recibe una consigna que le indica qu se espera de l, qu se busca que haga (responder preguntas, armar un rompecabezas, etc.) y al responder a dichas instrucciones generar un conjunto de comportamientos que el evaluador registrar cuidadosamente. Las condiciones del test pretenden lograr que el examinado emita una serie de comportamientos reducidos en un rea especfica de todos
los comportamientos que habitualmente genera. Todo esto implica que un test no evala todo el comportamiento de una persona, sino una muestra de todos sus comportamientos posibles, reducidos a un rea especfica o dentro de un rea especfica. Esta restriccin estar dad por aquello que se quiere evaluar en concreto y desde qu marco terico se har o interpretar dicha evaluacin. La teora implica un recorte dado de la realidad. Pero para que pueda llevarse a cabo la aplicacin de un test es necesario que se aporten evidencias empricas sobre la validez y confiabilidad de los resultados arrojados por la misma; Es decir que se deben llevar a cabo estudios empricos que den idea al usuario de dos cuestiones bsicas, por un lado si el test mide o evala aquello que dice medir ( la validez), y por el otro, si aporta resultados o mediciones en las que se pueda confiar, con un error de medicin predecible y determinable ( confiabilidad). En el rea de la evaluacin psicolgica existen otras pruebas a las cuales se puede recurrir en el rea de evaluacin, ella son las tcnicas proyectivas y la entrevista diagnstica. Las tcnicas proyectivas deben su nombre al supuesto de que se basan en el principio de la proyeccin, y ste es uno de los mecanismos de defensa con el que contamos los seres humanos para hacer frente a la ansiedad, al estrs y a las situaciones conflictivas o crticas. Tal repertorio de recursos yoicos se va formando a la largo del ciclo vital y nos ayudan a afrontar situaciones de desintegracin que son vividas como amenazas para el yo. La proyeccin supone exteriorizar poner en el afuera o adjudicar a otros aquellos contenidos inconscientes y preconscientes que forman parte de nuestra personalidad profunda. Pero para que este mecanismo se d, es necesario que exista una situacin de poca estructuracin, que mantenga cierta ambigedad y que no se halle muy clara o estrictamente definida. Dentro de las tcnicas proyectivas ms utilizadas podemos ver el test proyectivo del Dibujo de una Persona. El test de dibujo de CASA-RBOL-PERSONA. El dibujo kinetico de la familia. Con respecto a la entrevista libre, tambin puede considerarse una especie de tcnica proyectiva puesto que se asemeja a la pgina en blanco de los dibujos, en que se proyectan los propios contenidos inconscientes. Todas las tcnicas proyectivas comparten las caractersticas de poseer poca estructuracin en estmulos y consignas, dejando bastante abierta las respuestas posibles que, potencialmente, son infinitas. En cambio las tcnicas psicomtricas no. Tambin comparten el hecho de que todas ellas tienen un marco terico en comn; el psicoanlisis. Otra de las diferencias que las tcnicas proyectivas y las psicomtricas mantienen es que las primeras proponen la evaluacin de la personalidad como un todo, mientras que las segundas aslan atributos diversos, valorndolos de uno por vez. Las tcnicas proyectivas brindan una visin ms global de la personalidad del sujeto, debe tenerse en cuenta que cada vez que se aslen elementos, esta diseccin siempre se efecta de manera artefactual y a los fines de lograr una mejor comprensin de los mismos., pero los atributos psquicos de los seres humanos no son distinguibles en el comportamiento observable. Su separacin es en todos los casos, un artificio para entenderlos mejor desde un modelo terico dado.
A diferencia de la proyectivas, las tcnicas psicomtricas cuentan con consignas, estmulos y alternativas de respuesta altamente estructuradas, a la vez que pueden fundamentarse en diversos marcos tericos, en los que el psicoanlisis en una de las alternativas posibles. Y ello es aso que porque las variables evaluadas no corresponden a la personalidad profunda sino ms bien se trata de elementos tales como la inteligencia, las habilidades, la ansiedad, etc. Desde este punto de vista algunos autores consideran a la entrevista dirigida o cerrada como una tcnica psicomtrica, debido a su alta estructuracin. En cambio en la entrevista libre, en la que el sujeto habla sin ninguna restriccin sobre aquello que desee y del modo en que lo desee, puede ser categorizada como una tcnica proyectiva. La entrevista es una herramienta indispensable de acercamiento al examinado, ya que permite acceder fcilmente a la problemtica o caractersticas del mismo, as como despejar dudas, aclarar puntos oscuros y corroborar o refutar diferentes hiptesis interpretativas que pudieran haber generado a partir de los resultados arrojados por las tcnicas. Los test, como operacionalizaciones de constructos tericos. Todo test se basa en un modelo dado, y ese marco terico que fundamenta la tcnica apela a diversos conceptos o constructos. Los constructos o conceptos son construcciones ideales formuladas por la mente humana para explicar determinados aspectos o fenmeno de la realidad , como por ejemplo, la nocin de ansiedad, donde diferentes fenmenos observados como manifestaciones orgnicas o fisiolgicas seran indicadores de un concepto terico y abstracto que las agrupa en un fenmeno que las contiene; la ansiedad. Entonces la ansiedad en s misma no es un observable, ni pasible de ser medida, sino que son sus manifestaciones o indicadores los observables. Por lo tanto una vez que se ha definido y descripto este fenmeno se procede a operacionalizarlo. Operacionalizar implica bajar su definicin abstracta a la empiria mediante la identificacin de indicadores observables que den cuenta de la ocurrencia de este fenmeno en la realidad, y de esta forma todo constructo terico implica una definicin conceptual y una operacionalizacin. Mientras la definicin terica se ocupa de examinar distinciones relevantes desde un modelo terico a partir del cual se define el concepto, la definicin operacional u operacionalizacin implicara la elaboracin de un listado de indicadores u observables empricos que den cuenta presencia o ausencia de dicho fenmeno en la realidad, o bien, el grado en que se registra su ocurrencia. Y mediante esa prueba emprica la teora se corroborar o no con los datos de la realidad. Siguiendo este razonamiento podemos entender los instrumentos psicomtricos como un conjunto de indicadores de un concepto o constructo terico, ese conjunto de indicadores observables o medibles son los tems, elementos reactivos del test, indicando que se habr operacionalizado en forma consistente con la teora. Los tems, elementos o reactivos de un test son la mnima unidad distinguible en l, consistente en cada una de las pequeas tareas o actividades que el individuo debe
realizar para responder a la consigna. Estas actividades pueden consistir en confeccionar un dibujo, encajar piezas, elegir la opcin correcta, preferida o la ms frecuente, copiar formas, etc. El total de los tems forman la escala o prueba. Tambin puede suceder que dentro de la variable evaluada puedan distinguirse dimensiones subyacentes, y en este caso varios tems forman parte de un sub-test o sub-prueba integrando una sub-escala. Dos o ms sub-escala forman la escala total o Instrumento Psicomtrico. Entonces, el enfoque psicomtrico supone la medicin de un rasgo, caracterstica o atributo de una persona, que estar operacionalizado de manera coherente con un marco terico que se ha tomado como fundamento. Adems se haya involucrado la nocin de escalamiento que implica el convertir o traducir las respuestas brindadas por lo sujetos a una puntuacin (que puede ser cuantitativa o cualitativa). Todas esas respuestas quedarn registradas en lo que se llama protocolo, que es justamente eso, un registro de las respuestas brindadas por el sujeto. Luego el examinador codificar esas respuestas segn el sistema tipificado en el manual, para, finalmente obtener una puntuacin global, desde el punto de vista estadstico y metodolgico, es un ndice, es decir una puntuacin construida que nos servir para resumir la serie de respuestas dadas por el sujeto. La medicin posible del constructo evaluado por la tcnica debe tener cierta estabilidad temporal, que puede ser elevada o baja, pero debe de existir un mnimo de ella para que la evaluacin tenga algn sentido. Otro problema que debe atenderse es que el instrumento sea realmente capaz de captar las diferencias individuales que existen entre las distintas personas en cuanto al rasgo o atributo medido, es decir discriminar. Este concepto se refiere a la poder diferenciar de forma adecuada entre los sujetos que poseen el atributo analizado en gran medida respecto de quienes lo posee en un grado ms bajo o directamente no lo poseen. Es por eso que la discriminacin en psicometra debe servir para captar diferencias individuales, puesto que ese es su sentido; dando informacin sobre las caractersticas nicas de un sujeto, aquellas que lo diferencian de los dems. El test debe tener estudios empricos que hayan arrojado evidencias sobre la validez y confiabilidad. Los estudios de Validez permiten conocer de qu manera el autor del test u otros investigadores aportaron evidencias empricas de que ese instrumento est evaluando lo que promete evaluar o est midiendo otras variables. El autor original u otros investigadores deben aportar pruebas de que lo que se promete medir efectivamente se est midiendo, que esa prueba mide ese constructo segn la teora que se ha propuesto como fundamento, y con indicadores ( tems) adecuados para efectuar una medicin ajustada. Por otra parte, la confiabilidad de las puntuacin obtenidas mediante el test alude a la confianza que podemos tener acerca de los resultados concretos que est prueba brinda al medir el constructo aludido. Este concepto involucra varios aspectos en su definicin, tales como la estabilidad temporal, la consistencia de sucesivas mediciones, la
consistencia interna de los tems del instrumento, los errores que se producen al medir, y tambin la homogeneidad de los reactivos al interior de la tcnica. El test, por otra parte contar con ciertas propiedades o caractersticas formales, y esto se refiere a los materiales utilizados, a la forma de administracin, al objetivo de la evaluacin, al tipo de respuesta, al formato, al uso del tiempo, y fundamentalmente a la base sobre la que se comparan las respuestas o el desempeo del sujeto. Refirindose ahora al objetivo de la pesquisa, puede hablarse de Test de diagnstico, que se refiere al poder brindar al usuario una evaluacin detallada y pormenorizada de una situacin, un atributo o un estado o rasgo dado; y test de screening, rastrillaje o despistaje se usan para detectar riesgo, es decir que dan una evaluacin poco detallada, preliminar y que debe profundizarse ( por ejemplo, en el caso que querer detectar personas en riesgo de padecer trastornos de alimentacin en una poblacin amplia, no es posible aplicar a tanta gente una batera completa de instrumentos en virtud de los tiempos, el esfuerzo y los costos involucrados.). Los test de despistaje y screening son breves y altamente sensibles, es ms, es importante que sean sensibles en demasa y pocos especficos, ya que deben reaccionar fcilmente ante los mnimos indicadores de riesgo potencial. Es preferible que se detecten casos falsos positivos, en los que luego, en una evaluacin ms profunda, no se compruebe riesgo o patologa, antes que se deje sin identificar casos verdaderamente positivos que, de otra manera, pasaran desapercibidos en virtud de la baja sensibilidad del test. Una vez localizados estos casos mediante el instrumento de despistaje, se vuelve a examinar a esos sujetos pero en esta oportunidad con tcnicas de diagnstico, que brindarn una informacin ms acabada y completa, permitiendo confirmar los resultados iniciales o descartarlos. Estos elementos de screening funcionan como un filtro que separa los elementos ms gruesos para que sean examinados en detalle mediante tcnicas diagnsticas, decidiendo a posteriori si existan razones de peso para seleccionarlos o si simplemente, se trat de un caso falso positivo. Las tcnicas de diagnstico darn informacin ms profunda y pormenorizada, sobre la variable que se est evaluando, sus tiempos de administracin y evaluacin sern, por ende mayores, pero permitirn arribar a una descripcin ms acabada, completada por una cierta cantidad de datos y detalles. De manera contraria las tcnicas de screening sern menos sensibles pero ms especficas. En cuanto a los materiales y medios utilizados se encuentran en el mercado test de lpiz y papel, materiales manipulables, de estmulo oral y respuesta oral, de estmulo grfico y respuesta oral o de estmulo oral y respuesta escrita, entre otras posibles. En referencia a la forma de administracin, puede decirse que existen dos grandes grupos de instrumentos; los de administracin individual y los autoadministrables. Los primeros requieren por el tipo de tarea implicada, la interaccin personalizada de un examinador con un examinado, en tanto que los autoadministrables estn especialmente diseados para que sus consignas, materiales y sus tems sean tan claros que el sujeto de las respuestas sin ayuda, o con una mnima gua del evaluador. Con respecto al objeto de la evaluacin, alude a un gran grupo de conceptos o variables al que pertenece aquel constructo que se quiere evaluar.
10
Tomando en cuenta el tipo de respuesta, las pruebas psicomtricas pueden dar diferentes tipos de respuestas; las dicotmicas, que es la que pone el examinado ante la obligatoriedad de decidir su respuesta entre dos opciones polares (verdadero-falso si no). De esta manera se debe suspender el pensamiento de tipo depende de la situacin, y forzarse a s mismo a escoger una respuesta. La respuesta Likert que implica un ordenamiento de las opciones segn un gradiente que va desde la mxima aceptacin al mximo rechazo. O viceversa. Tambin pueden plantearse por ejemplo, respuestas Likert en trminos de frecuencia de aparicin temporal de los comportamientos u otras alternativas de categorizacin posibles. El diferencial semntico, que es una forma de respuesta que prev una escala, generalmente de siete o de nueve puntos, en cuyos extremos se ubican dos adjetivos o expresiones con significados contrapuestos, y se solicita al examinado que marque en qu punto de ese continuo ubica su pareja con respecto a aquellas variables que se estn evaluando, en trminos de valorar significados posibles de ser atribuidos. En los test de resolucin de tareas especficas se pide al sujeto que realice una produccin determinada (copiar tarjetitas, dibujar bajo determinadas condiciones, formar figuras de cubos, resolver un laberinto o un rompecabezas, codificar nmeros arbigos en una simbologa especial que debe ser aprendida, recordar palabras y repetirlas etc. Esas respuestas suelen ms tarde re-codificarse segn criterios diversos, por ejemplo como xito o fallo, como respuesta completamente adecuada, parcialmente adecuada o inadecuada, entre otras variaciones posibles. Segn su formato, las tcnicas pueden dividirse en; Inventarios; que son listados de afirmaciones que el sujeto debe leer y responder, por ejemplo, segn opciones de verdadero o falso, o segn el gradiente en el que expresa el acuerdo o desacuerdo. Los cuestionarios en cambio son listados de preguntas que el sujeto debe responder segn formato preestablecido (si-no), segn el grado de conformidad o frecuencia con respecto a lo que se est interrogando. Las escalas, por su parte, suelen identificarse con algunos test de rendimiento que tienen un formato diferente de los inventarios o cuestionarios, y que se componen, por ejemplo de tareas que el sujeto debe resolver o de preguntas que debe contestar para reflejar algn conocimiento o destreza. Sin embargo todos los instrumentos psicomtricos son escalas dado que implican, como decamos antes, la nocin de escalamiento, que significa convertir las respuestas de los examinados a una puntuacin que las resumen. Las encuestas suelen tener un formato similar al de los inventarios y se utilizan para recolectar opiniones o actitudes de las personas sobre algn tema en especial, sobre un servicio o sobre costumbres y preferencias. Las entrevistas dirigidas son listados de preguntas preestablecidas que se hacen oralmente al sujeto en una administracin individual y que deben responderse oralmente, con la posibilidad de ampliar esas contestaciones por medio de comentarios y detalles. Finalmente las hojas de registro o protocolo de observacin son tambin formularios pre impresos que establecen qu aspectos especficos deben observarse en determinados comportamientos o interacciones, en los que el examinador u observador va codificando en una forma abreviada y rpida aquello atributos que son objeto de su evaluacin.
11
En cuanto al uso del tiempo, existen tcnicas que no fijan un lmite temporal para finalizar la tarea, otras en cambio establecen un lmite preciso de tiempo de respuesta, finalmente otros test permiten que se trabaje libremente pero se toman notas del tiempo para valorarlo en una forma determinada. Ahora bien, en la base sobre la que se valoran o comparan las respuestas o desempeo del sujeto evaluado, podemos clasificar los instrumentos psicomtricos en test normativos y test de criterios o de dominio. La primer modalidad de valoracin de los resultados corresponde a las tcnicas psicomtricas que se rigen por baremos o normas estadsticas. Ellos comparan el rendimiento o respuesta de una persona individual con el rendimiento promedio registrado por una muestra normativa o de tipificacin, es decir, por un grupo de individuos homogneos al examinado, segn edad, sexo, hbitat y otras condiciones que pudieran afectare a la variable evaluada. As el baremo o norma estadstica es un cuadro de doble entrada en el que se consignan el promedio de las puntuaciones obtenidas por la muestra de sujetos y su dispersin o desviacin tpica. Permite que el examinador valore el desempeo de un sujeto a la luz del desempeo promedio observado por sujetos semejantes a l. Los test de criterio o dominio, en cambio, no emplean normas para comparar el desempeo o respuesta del individuo, sino que las valora segn un criterio previamente establecido (ejemplo, si los sntomas de depresin coinciden con lo que establece el DSMIV o el CIE-10 Por ltimo, debe tenerse presente que todo instrumento tiene su sentido en tanto y en cuanto est enmarcado en un proceso de Evaluacin Psicolgica, cobrando valor e importancia en virtud del interjuego que sea posible establecer entre los resultados que arroje y el resto del material que se valorar, sin perder de vista el objetivo final de este proceso; La evaluacin Psicolgica, entendida como un proceso de toma de decisiones que funciona como una instancia consultiva, en tanto es solicitada por el interesado o por un tercero, para dar respuesta a alguna pregunta o consulta, o para indicar un curso de accin o solucin a algn problema. tica del Evaluador en Psicologa; Consideraciones Bsicas. En lneas generales se dir que el profesional que se desempee en el rea debe ser consciente de la influencia potencial que su trabajo puede tener en la vida de personas reales y concretas. La plena conciencia de cuanto se sabe y canto se ignora, de cuales son las reas de vacancia en sus conocimientos, sumandos a la actitud responsable y honesta, permitirn la capacitacin permanente y la derivacin de aquellos casos en los que no se est habilitado en virtud de limitaciones profesionales y/o personales. Por otro lado, hay que tener en cuenta cuales son los derechos de todo examinado; el tener acceso a la mejor atencin que podamos brindarle, ser tratado con el mayor de los respetos, poder dar el consentimiento informado para que la evaluacin sea realizad, trabajar en un clima ameno, cordial y relajado, tener acceso a los resultados y recomendaciones surgidos de la evaluacin en forma completa y adecuada a sus posibilidades intelectuales, emocionales y educativas, guardar los requisitos bsicos de
12
una estricta confidencialidad notificndole quines y de qu forma tendrn acceso a esos resultados, contar con la autorizacin explcita de los padres para realizar evaluaciones a menores o personas judicialmente insanas, con dificultades de comprensin o con patologas de alteracin en el juicio de realidad, entre otros recaudos. Todos los cuidados antes mencionados implican una actitud activamente tica. Es importante no olvidar las diferencias culturales resultantes de la diversidad poblacional en nuestro pas, el respeto por las peculiaridades culturales, religiosas, cosmovisiones, sexuales, sociales y de cualquier otra esfera del comportamiento humana, es la herramienta bsica para la asuncin de una postura abierta, humilde, emptica, contenedora hacia el otro, y carente de prejuicios, al menos con la menor cantidad de prejuicios posibles y siendo conscientes de ellos Estas cuestiones deben tenerse en cuenta a cada paso del proceso de evaluacin y por lo tanto, tambin en el momento de elegir la batera de instrumentos a ser utilizada, a la hora de administrarla y en el momento de puntuar los protocolos, al efectuarlas interpretaciones y tambin al comunicarlas a los interesados. La actitud correcta consiste en una postura de total vigilancia respecto de estos tpicos, ya que podemos estar trabajando con personas concretas y reales con especificidades macro o micro culturales que no hayamos detectado, y por lo tanto, tal vez estemos efectuando valoraciones que no corresponden a aquellas, y que estemos mirando la realidad desde nuestra perspectiva cultural y no desde la que corresponde al sujeto. Hay que prestar plena atencin a las caractersticas particulares de cada persona, aquellas que la hacen nica e irrepetible, para ello es importante mantener actualizados nuestros conocimientos sobre psicometra, tcnicas proyectivas, psicologa general, evolutiva, psiquiatra, etc. Nunca debe olvidarse que el examinado es un ser bio-psico-social, que posee por ende, las tres clases de componentes o atributo, sin perder de vista ninguno de ellos. Pensar en analizarlos separadamente ya implica una postura frente a la posibilidad de distinguirlos, ya que se trata de fenmenos que no tienen que ver con la forma en que stos se den en la realidad, sino con nuestra manera de conceptualizarlos y de aislarlos para entenderlos y estudiarlos mejor. Bla bla bla La validez y los instrumentos psicomtricos: En primer lugar, el sentido ltimo de las escalas psicomtricas es la capacidad de un instrumento (de sus tems) para captar diferencias individuales en la variable que est siendo medida, la determinacin de diferencias en un atributo dado entre las distintas personas. Si los tems de una prueba poseen una baja capacidad discriminativa, entonces, su utilidad se reduce considerablemente. Por ello los autores tienen la obligacin de proporcionar a los usuarios resultados empricos sobre tal poder discriminativo. Esto se refiere a la capacidad discriminativa de un instrumento psicomtrico. En segundo trmino, la confiabilidad de una prueba refiere a la confianza que podemos tener en los resultados que arroja, confianza que puede ser examinada desde varios aspectos, pero que principalmente se dirige a valorar cunto error existe en la medicin,
13
asumiendo que siempre se incluyen errores en la misma, ya que no es posible concebir medicin alguna que est completamente libre de error. En tercer lugar, debemos ocuparnos de la validez de la escala. Tradicionalmente se alude a la validez mediante la pregunta referida a qu mide la tcnica. Que un test haya sido nombrado como prueba de inteligencia o de memoria o de personalidad, no implica necesariamente que mida las variables que figuran en su denominacin. El autor debe proporcionar pruebas empricas (resultados verificados, verificables y replicables por otros investigadores) que demuestren que efectivamente se est midiendo la inteligencia y no la memoria, o la persistencia o cualquier otra variable no identificada, diferente de la que se pretende evaluar en el propsito explcito declarado en el manual del instrumento. Por lo tanto jams debe darse por sentado que la denominacin de la tcnica responde exactamente al constructo que se pretende evaluar. Debemos contar con pruebas empricas que lo hayan verificado, aportadas por los autores del test mismo, as como por otros investigadores que lo hayan analizado ulteriormente. Esos resultados sern uno de los fundamentos bsicos que contribuirn a asegurar la calidad de la tcnica que nos ocupe, dado que se refieren a uno de los atributos que certifican esta calidad; la validez de las puntuaciones que las pruebas permiten obtener. As, se comprueba que la validez de un instrumento se refiere a que esa herramienta sirva para medir aquello que intenta medir. El test debe medir el constructo que se ha propuesto o que ha prometido medir. Pero en la actualidad, ya no se habla solamente de capacidad de discriminar, su confiabilidad y validez, como instrumentos inherentes al test, ya que ello crea cierta sensacin de invariabilidad, de permanencia o de fijeza. Actualmente nos referimos a la confiabilidad y la validez de los resultados arrojados por el test, as como la capacidad discriminativa de sus tems en tales o cuales sujetos, que poseen tales o cuales caractersticas determinadas. Esto significa, en primer lugar, que la validez y la confiabilidad de los resultados no vienen dadas con el instrumento, sino que la validez y confiabilidad de los resultados no vienen dadas con el instrumento, sino que se hallan sujetas a ciertas condiciones, referidas especialmente a la variabilidad de la muestra de los sujetos que se ha utilizado para poder a prueba, justamente, la validez y confiabilidad de los resultados, as como la discriminacin de los tems que componen la escala. En segundo lugar, tambin quiere decir que los atributos vinculados a los resultados arrojados por el instrumento deben ser empricamente determinados mediante investigaciones cientficas meticulosamente planificadas y desarrolladas, a la vez que tales estudios deben ser replicados y/o rediseados a intervalos relativamente cortos, as como cada vez que la prueba se traslade de un contexto cultural a otro. Cuando un instrumento psicomtrico se estandariza, se trabaja este proceso de tipificacin con muestras de sujetos que renan caractersticas homogneas a las personas que se ha destinado esa prueba. Por ejemplo, si se trata de una escala para nios, la estandarizacin o tipificacin se realizar sobre una muestra infantil.
14
Ahora bien, en estadstica y psicometra se habla de una caracterstica especfica de la distribucin de puntuaciones obtenidas por la muestra de sujetos en un test, que es la variabilidad o dispersin de la misma, ya que las medidas de variabilidad indican si las puntuaciones o valores obtenidos por los distintos sujetos que componen la muestra estn prximos entre s, o si por el contrario se encuentran muy dispersos. De esta forma, si la variabilidad es pequea, este dato nos informa que la mayora de las puntuaciones se ubican cerca de la media o promedio. Por el contrario, si la dispersin es grande, podemos inferir que las puntuaciones se ubican dispersas en relacin a la media. Justamente esta variabilidad es la que afecta los resultados que se obtienen en estudios desarrollados para determinar la validez y la confiabilidad de las puntuaciones arrojadas por un test. Y es por esto tambin que la validez de las puntuaciones se encuentran influidas por la variabilidad de la muestra sobre la que esa validez se determina: No se registraran iguales resultados si se la compara con muestras cuyos rendimientos hayan sido muy similares entre s. Por lo tanto, el concepto de variabilidad muestral da cuenta de que los estudios de validez se efectan sobre muestras compuestas por personas reales, con respuestas y rendimientos concretos y reales, es que tales resultados de dichas investigaciones se encontrarn directamente afectados por esta caracterstica de la muestra de sujetos, la cual no es ni ms ni menos que el resultados del conjunto de atributos psquicos especficos y distintivos de un grupo de individuos dado: Estas diferencias, que parecen distinciones numricas extraas, no son ni ms ni menos que diferencias registradas en el rendimiento real observado por personas reales y que por lo tanto, afectarn los estudios que se hagan sobre tales sujetos. Distintos tipos de validez; Existen diversas nomenclaturas sobre los aspectos a ser tenidos en cuenta en relacin con el concepto de validez o, como se expresa hoy en da, con las diferentes evidencias de validez que pueden ser aportadas sobre los resultados arrojados por un instrumento psicomtrico dado. En lneas generales es posible distinguir cuatro grandes reas en las que pueden categorizarse las distintas implicaciones del trmino validez; el rea del contenido, el rea terica y el rea formal. 1. Aspectos de la validez vinculados con el contenido del test; se refiere a la las evidencias de validez de contenido, se basa en la verificacin de que la muestra de tems incluida en el test cubra, efectivamente, todos los aspectos o dimensiones relevantes de la variable en estudio a ser medida. Los reactivos o elementos que se han redactado o ideado para formar parte de un instrumento psicomtrico, son solo una muestra de todos los tems posibles, es decir, del universo de tems destinados a medir esa variable en particular. De todos los posibles, los finalmente incluidos debern integrar una muestra representativa de todos los tems posibles, guardando idnticos criterios de representatividad a los usados para resolver el muestreo de los sujetos con los que se trabajar para estandarizar el test ( los finalmente incluidos tienen que cumplir con el criterio fundamental de no haber descuidado ninguna de las dimensiones de la variable).
15
Esta tarea debe ser desempeada por los diseadores originales del instrumento y posteriormente controlada en aquella instancia que se conoce como juicio de experto, el cual est destinado a trabajar sobre los aspectos de la validez que se relacionan con el contenido de los tems. El juicio de experto es un procedimiento mediante el que los autores del test convocan a un pequeo grupo de expertos en el tema que se quiere evaluar mediante esa nueva escala, para que juzguen, en una primera aproximacin, la adecuacin de cada uno de los tems que se han formulado para formar parte del instrumento, en relacin a su coherencia o concordancia con alguna de las dimensiones propuestas por el autor en ese modelo terico. As, estos expertos, ayudados por una lista detallada de especificaciones que los autores, revisarn el contenido y la redaccin de cada tem y su adecuacin con respecto a cada dimensin prevista por la teora, efectuando crticas a alguno de ellos, mostrando su conformidad con respecto a otros, sugiriendo modificaciones en otros casos, y alertando sobre aquellos aspectos o dimensiones de la variable en cuestin que estuvieren menos representados en el total de elementos o hubieren sido descuidados en aquellas. Cada experto trabajar de en forma independiente y har llegar su evaluacin a los autores quienes, en un segundo momento, darn el dictamen de cada uno de los expertos en base al conjunto de todos los dictmenes recogidos, efectuando sobre los tems propuestos aquellas modificaciones que hayan sido sugeridas por la mayora. Los criterios a partir de los cuales los autores modificarn, reemplazarn o eliminarn tems, deber haber sido fijado de antemano y ser respetado a raja tabla, con el fin de evitar que la subjetividad de los creadores de la herramienta interfiera en demasa en ente proceso. As, este procedimiento implica vigilar activamente que todas las dimensiones de la variable a ser medida hayan sido debidamente cubiertas, con el peso y la importancia que la teora asigna a cada una de las mismas. Frecuentemente se califica este procedimiento de juicio de experto como un medio subjetivo de aportar evidencias de validez terica, pero al ser varios expertos, tambin esa subjetividad individual se ve disminuida. 2 Aspectos empricos de la validez vinculadas al criterio; Tambin se la llama validez emprica, ya que se rige por la experiencia, y en este punto ha y dos cuestiones a plantear. Por un lado aquello que se relaciona con que este tipo de evidencia de validez, como las anteriores, deben ser establecidas empricamente (en base a estudios de campo realizados con rigor metodolgico y sobre personas concretas). En segundo lugar, el trmino validez emprica remite a un tipo de evidencia que se vincula con el uso prctico (en virtud de qu informacin no aporta en concreto si lo administramos a un tipo de sujetos en particular). Por lo tanto, involucra una metodologa de investigacin que, necesariamente, trabajar utilizando lo que se conoce como criterio externo, y que es una medida de la misma variable que el instrumento intenta medir, pero obtenida de forma independiente de aqul. Ser esa medicin externa a la prueba la que nos
16
permitir verificar si la escala nos brinda una informacin semejante a la obtenida mediante esa medicin independiente o criterio externo. El criterio externo que se emplee para llevar a cabo esta investigacin deber estar sustentado en el mismo marco terico que el instrumento cuyos resultados se desean validar, y por ende, operacionalizar en forma similar. Validez Concurrente; Un evaluador buscar recabar cierta informacin acerca de determinados atributos del sujeto, en el menor tiempo posible, con el fin de responder determinadas preguntas relacionadas con un problema. Esto es as porque el evaluador busca estar seguro que el nuevo test, del que an no conoce su calidad, le permita acceder a esa cierta informacin o los mismos resultados que podra obtener por otros medios. Es decir que para verificar si estamos midiendo aquello que la escala pretende medir, adems de asegurarnos de que los pasos relativos a las evidencia de validez terica y de contenido hayan sido examinados, deberemos controlar tambin que se haya corroborado fehacientemente que puede medirse lo mismo. ,o casi lo mismo, que el test promete medir mediante un camino o criterio independiente al mismo test, externo a l. Es por ello que la validez emprica es tambin llamada valides de criterio. Por ejemplo, a la misma muestra de sujetos a la que se ha aplicado una prueba, se la har objeto de una observacin sumamente detallada y minuciosamente pautada, que funcionar como criterio externo, que deber ser determinada a priori con idnticos criterios que los utilizados para la construccin de la escala. Ellos significa que ambas vas de evaluacin ( tcnica y criterio externo) apuntarn, al menos hipotticamente, a medir la misma variable y segn el mismo modelos terico, ya que ambos han sido diseados con tal propsito. Se utilizar un coeficiente de correlacin para valorar el grado en que ambos caminos de evaluacin se hallan asociados, es decir, coinciden. El coeficiente de correlacin es un ndice que nos informa el grado de covariacin o asociacin entre variables, tratndose de una correlacin directa (de signo positivo) cuando ambas variables aumentan o disminuyen juntas, por ejemplo a mayor cantidad de trabajo, mayor cantidad de tiempo para terminarlo; y siendo la correlacin inversa (de signo negativo) cuando al aumentar una de las variables, la otra disminuye o viceversa, como por ejemplo, la antigedad del modelo de un auto y su precio, ms antiguo el auto menos se cotiza en el mercado. Independientemente del signo o sentido de la correlacin, el grado de asociacin entre las variables consideradas ser mayor cuanto ms se acerque su coeficiente a uno, y ser menor cuanto ms cerca de cero se ubique. A s una correlacin perfecta de +1 nos indicar una covariacin directa entre las variables, ya que ambas aumentan o disminuyen juntas, y perfecta porque las variables estn asociadas completamente en un 100% (ejemplo, ms invitados, ms tazas para servir caf). Una correlacin ser nula (= 0) cuando la asociacin entre variables sea inexistente (ejemplo, la cantidad de dinero que uno tiene en el banco y la cantidad de lunares en el cuerpo).
17
Existen correlaciones no perfectas cuando encontramos asociacin entre dos variables, cualquiera sea su signo, distintas a cero y distintas de uno. All hallaremos coeficientes por ejemplo de 0,90 o -0,90, que implica un alto grado de covariacin entre las variables (cercano a 1), o 0,15 o -0,15, que implica un grado bajo de asociacin entre las variables. De ninguna forma una correlacin, an la ms elevada, puede interpretarse como una variable determinando o causando a la otra, sino que simplemente se muestran la asociacin o correlacin entre ellas. En el caso de un estudio de validez concurrente, si el coeficiente de es positivo y elevado, estar indicando que ambas mediciones (criterio y escala) realizadas a una nica muestra de sujetos arrojan resultados muy similares, por lo que ser prcticamente lo mismo medir la variable deseada mediante la prueba o mediante el criterio, quedando a posteriori el proceso de validacin, y si se dispone de tiempo se podr utilizar la segunda va. Pero si se desea conocer estos resultados en un lapso muy breve y con menos esfuerzo, se administrar el test. De esta forma el estudio ha arrojado evidencias de validez emprica o de criterio, de tipo concurrente. Esto significa que tcnica psicomtrica y criterio concurren juntos, en un mismo sentido, arrojando idnticos resultados o muy similares. La nomenclatura tcnica de validez emprica designa rx y r simboliza el coeficiente de correlacin de Pearson x representa la puntuacin obtenida en el test por la muestra de sujetos y representa la puntuacin obtenida por esos mismos sujetos en el criterio Externo. Ahora bien, cuando aludimos al uso de un criterio externo en los estudios de validez concurrente, inmediatamente surge la pregunta prctica; si el test y criterio brindan informacin comparable para qu usar el primero, si con el segundo ya basta? La formulacin o eleccin de un criterio externo se relaciona con la necesidad inherente al diseo de investigacin que se plantea en un estudio que pretende aportar evidencia de validez emprica de los resultados a los que el instrumento conduce, pero ello no es obstculo para que en el mbito de aplicacin el usuario elija libremente aquella va de evaluacin que prefiera, en base a su modalidad de trabajo, a los tiempos, condiciones disponibles y al esfuerzo y cantidad de informacin resultante que est en condiciones de invertir y de procesar. Validez predictiva; La otra variante de validez emprica o de criterio es la validez predictiva. Comparte con la validez concurrente su pertenencia a la categora de validez emprica. Ambas son los dos tipos principales previstos en ella. Posee adems una lgica similar a la de la validez concurrente trabajando, con un criterio externo y un coeficiente de correlacin. La diferencia radica en que la validez concurrente se establece en y para el momento presente, el aqu y el ahora, con el fin de asegurar que la escala mide aquella variable que prometa medir; prueba y criterio externo deberan medir la misma variable para que se concluya que se han aportado evidencias de
18
validez concurrente. La validez predictiva, en cambio, trabaja a futuro y con un criterio externo a predecirse. Un estudio destinado a aportar evidencia de validez predictiva se basa en la idea de intentar verificar que el instrumento administrado en el presente, resulte un buen predictor de otra variable, relacionada tericamente con la que se ha medido pero distinta. Por ejemplo, se planifica usar una prueba de aprendizaje de contenidos verbales, y se vuelve indispensable para ello demostrar que el test de capacidad de aprendizaje de contenidos verbales administrados hoy, resulta un buen predictor del desempeo futuro del alumno. La diferencia entre la validez predicativa y la concurrente radica en que la primera el criterio se predice y es otra variable, mientras que en la concurrente el criterio se mide en el mismo momento o casi, en que se administra la prueba y es la misma variable evaluada por el instrumento, ero obtenida por medio de una medicin independiente a la prueba. Y lgicamente, en la predictiva se intenta predecir el criterio a futuro, en tanto que en la concurrente se intenta que concurran o coincida con los resultados de la escala en el mismo corte temporal. Pero la principal diferencia no se basa en el tiempo sino en los objetivos de la evaluacin, mientras que la concurrente es elegida cuando la prueba va a utilizarse para efectuar diagnsticos del estado actual, la predictiva lo ser cuando el instrumento busque predecir resultados futuros, es decir que el uso de la escala ser el criterio decisorio que permitir dirimir qu tipo de estudio de validacin se emplear. Un concepto a tener en cuenta en el tema de las evidencias de validez predictiva es el de validez incremental. Y se refiere a que puede haber evaluadores que tengan inters en establecer la probabilidad de predecir algn criterio a partir de una multiplicidad de test y no de uno solo, o a partir de varios predictores y no de un nico predictor. Cada test debera contar con evidencias sobre su validez incremental, entonces, implica conocer el grado en que cada predictor explica o predice algo de la medida del criterio que no estaba predicho por los otros test o predictores. Por ejemplo, si se quiere evaluar el rendimiento acadmico, ste podra predecirse a partir de resultados obtenidos en varios test, uno de razonamiento verbal, otro de razonamiento abstracto, y otro de ansiedad a los exmenes. Si solo se intenta predecir el rendimiento acadmico mediante el desempeo en el test de razonamiento verbal, el criterio podra ser estimado con un margen de probabilidad dado, pero si se agrega un segundo predictor, como puede ser el razonamiento abstracto, se incrementara el grado en que se predice el criterio rendimiento acadmico. Un nuevo predictor incrementa la capacidad de ese grupo de predictores para estimar el criterio. Validez Retrospectiva; Tambin es un aspecto de la validez emprica o de criterio, y se vincula con la correlacin verificada entre los resultados de un test administrado en un momento determinado y un criterio externo medido con antelacin a la aplicacin del instrumento psicomtrico. Este tipo de evidencias de validez adquieren
19
importancia en ciertos mbitos especficos, tales como la prevencin psicolgica en la salud pblica o en la clnica individual. 3 Aspectos de la Validez Vinculados con el Modelo terico que sustente la prueba; Los aspectos tericos de la validez se circunscriben a que los autores del test u otros investigadores sean capaces de aportar evidencias de que tal operacionalizacin ha sido efectuada de forma coherente con ese modelo terico y cubriendo todos los aspectos o dimensiones incluidos en l. Por un lado, los investigadores especializados en psicometra que se han ocupado de disear o de estudiar un test construido por otro investigador, debern aportar evidencias verificables de que ese instrumento mide efectivamente el constructo o variable que dice medir, es decir, que tal constructo ha sido adecuadamente operacionalizado en indicadores (tems del test) capaces de aportar mediciones adecuadas de los distintos aspectos o dimensiones de tal variable. Hay que analizar con minuciosidad el captulo de referente a las evidencias de validez recogidas por distintos autores en diversas muestras de sujeto. Para muchos autores, el tipo principal de evidencia de validez, la terica (tambin llamada estructural o de constructo) se dedicar a responder a la pregunta de si esta tcnica mide efectivamente aquello que dice medir, segn tal o cual modelos terico, y por lo tanto, si la misma es una adecuada operacionalizacin de un constructo terico dado, derivado de ese modelo. La validacin de constructo se define como un proceso continuo (durable en el tiempo), en tanto requiere de investigaciones desarrolladas y renovadas en forma permanente, por medio del que se realizan mltiples investigaciones con el fin de poner a prueba diferentes hiptesis sobre la estructura interna del constructo, as como de sus relaciones con otras variables o constructos. Tambin se la puede definir como el grado en que un test mide un constructo, en tanto es una buena operacionalizacin del mismo. La validacin del constructo implica la acumulacin gradual de diversas fuentes de informacin, por lo que no es posible considerarla como un proceso terminado, sino que necesita de constante actualizacin e investigacin. Existen varias formas para verificar que sea una operacionalizacin y por ende, es coherente con el modelo terico. Se pueden realizar; Estudios evolutivos, donde al evaluarse determinada variable, se podra demostrar mediante sus resultados que, por ejemplo a medida que la edad aumenta se incrementa tal habilidad. Este tipo de investigaciones evolutivas es uno de los mtodos ms sencillos para aportar evidencias sobre la validez terica de un test. Estudios clnicos, la cual presenta una lgica similar de razonamiento, cuando se usan estudios clnicos si el constructo evaluado implica algn tipo de patologa. Los diferentes aspectos de la validez se relacionan, y en muchos casos n mismo tipo de estudio podra brindar evidencias hacia ambas aristas del tema de la validacin de los resultados aportados por el instrumento. Todo uso emprico se vincula con el modelo terico (validez
20
de constructo), y a la inversa, todo resultado emprico que se obtenga impacta directamente en los cuestionamientos, refutaciones o confirmaciones que puedan hacerse sobre un modelo terico. Anlisis Factorial, que son el tipo de investigaciones ms comnmente empleados en nuestros das para aportar evidencias sobre la validez de constructo de los resultados brindados por un instrumento. El anlisis factorial es un procedimiento de anlisis multivalente de los datos que permite analizar la variable, por medio de un test en una muestra de sujetos dada, determinando que dimensiones podran aislarse en la misma. Se lo define como un mtodo de reduccin de datos, por el que es posible disminuir la cantidad de datos a ser analizados o tenidos en cuenta. Se maneja por medio del clculo de mltiples coeficientes de correlacin entre las respuestas de todos los sujetos incluidos en la muestra a cada uno de los tems del test. As se calcula la correlacin de las respuestas dadas por el grupo al tem 1 cada total de respuestas dadas a cada tem de la escala. Esto dar lugar a lo que se conoce como una matriz de correlaciones en la que podemos aislar en el test. Este clculo de mltiples factores implica, intentar conocer el grado de correlacin o covariacin que tiene el total de las respuestas emitidas por los sujetos, es decir, como se asocian los contenidos a los que ellos aluden. De esta forma aquellos elementos que hayan registrado entre si elevados grados de asociacin se agruparn bajo lo que se llama un factor, dimensin o variable latente. Cada uno de estos factores ser un grupo de tems que aludan a contenidos relacionados, cuya vinculacin o asociacin se ha verificado mediante la agrupacin de aquellos reactivos que guarden considerable asociacin entre s. Si la cantidad de factores aislados o identificados y sus contenidos coinciden con la cantidad e identificacin de las dimensiones previstas en la teora, entonces, podr decirse que el test es un adecuada operacionalizacin del tal marco terico, o bien que mide tal variable segn tal teora. Validez Convergente y Discriminante; En estos aspectos tericos de la validez de constructo, se pueden distinguir dos grandes aspectos; las evidencias de validez de convergente, que implica si se ha podido recoger evidencias de que el constructo medido por el instrumento converge en el mismo sentido que otra evidencia relacionada por similitud, que se verifica la relacin entre el constructo vinculado tericamente. Y las evidencias de validez discriminantes, se verifican cuando se obtengan coeficientes de correlacin relativamente bajos entre constructos diferentes del que se desea medir. Que el modelo ha concebido como relacionados tericamente pero con una frecuencia de aparicin conjunta en la realidad muy escasa.
21
Ambas evidencias de validez contribuyen a la validacin de algunos aspectos del modelo terico que la sustenta. 4 Aspectos de la validez vinculados con las caractersticas formales de la prueba; Se refiere a la validez aparente y tiene que ver con que el instrumento resulte vlido a los ojos del examinado, ya que si los materiales, la consigna, el estilo de respuesta o las condiciones propuestas para el examen dejan de aparecer como serias o adecuadas a su edad o sus caractersticas, podra suceder que los sujetos vieran afectada su actitud de respuesta, producindose un efecto contrario a lo deseado en aras del logro de un buen rapport. Sesgo y Error sistemtico; El concepto de sesgo se relaciona al de validez, y se define como un error constante o sistemtico como opuesto al aleatorio o azaroso que impide la medicin precisa e imparcial del constructo a evaluarse. Por accin de ese sesgo, la probabilidad de xito no es independiente del subgrupo poblacional al que pertenece el examinado. Ello significa que, aunque el instrumento haya sido estandarizado para un grupo poblacional dado, un subgrupo dentro de ese grupo mayor generar probablemente, respuestas atpicas o no exitosas, por accin de la pertenencia a ese subgrupo (concertada con la generacin de un error sistemtico) y no por otras razones. El error sistemtico puede estar dado por cualquier componente inherente a la prueba, como por ejemplo, los materiales, el sistema de respuesta, los contenidos, las consignas u otros. Se acumula porque se da siempre de la misma manera y en el mismo sentido. Y a partir de ello, el test mide distintos constructos o genera distintos pronsticos, funcionando en forma diferencial en grupos disimiles, por razones ajenas a la variable que la escala est destinada a medir. Por lo tanto un test que presenta sesgo y error sistemtico deja de arrojar resultados vlidos y por lo tanto el instrumento no mide aquel constructo que dice medir.
Las Puntuaciones de los Test; Ya se ha hecho referencia a los cuatro niveles de medicin de Stevens, como la asignacin de nmeros o smbolos a objetos o fenmenos siguiendo ciertas reglas. De acuerdo con esta definicin, los instrumentos de medicin psicolgica,, o sea, las pruebas psicomtricas, quedaron caracterizadas como aquellas que permiten relevar y/o procesar informacin psicolgica en nmeros. Pero conviene aqu distinguir entre palabras nmero y numeral. Los numerales son smbolos numricos, mientras que el nmero es la cantidad que estos smbolos representan. Si los signos numricos se asignan a las distintas modalidades que puede tener una variable no cuantitativa, estos smbolos solo funcionan como numerales, y ente caso no tiene sentido hacer operaciones matemticas entre ellos. Solo si los
22
numerales guardan una relacin fija cuantitativa entre ellos, permite realizar operaciones matemticas bsicas y se llamarn nmeros. Es decir que los numerales pueden representar cualidades o cantidades pudiendo distinguir; 1. Numerales nominales- que solo sirven para nombrar las distintas modalidades de la variable, y estara haciendo una medicin cualitativa, el cual le da lugar de nivel de medicin nominal. 2. Numerales ordinales- aqu se pueden posicionar las modalidades de las variables. A esta medicin se la denomina semi-cuantitativa, y el nivel de medicin es el ordinal. 3. Numerales Cardinales- aqu se cuantifican las modalidades de la variable y el numeral es el nmero. La medicin es cuantitativa, y de acuerdo con ello quedan definidos los niveles de medicin como de razones e intervalar, que solo difieren en la naturaleza de su cero, y por eso conjuntamente se los suele tratar como un nico nivel de medicin denominado escalar. Las reglas a las que refiere Stevens en su definicin apuntan a la existencia de un isomorfismo entre los nmeros y los fenmenos psicolgicos que se pretende medir. Y grado de isomorfismo que presenten definir las propiedades matemticas que podrn aplicarse ente esos nmeros, y verificarse empricamente entre los fenmenos psicolgicos por ellos representados. Medicin Psicolgica; Al realizar una medicin debe especificarse no solo el valor medido sino tambin el error con que este se calcula, el cual a su vez tiene relacin con la facilidad de acceso a la informacin sobre lo que quiere medirse. Desde este punto de vista las mediciones pueden clasificarse en; Directas- sern aquellas donde el fenmeno a medir pueda observarse a travs de los sentidos, se puede contar, calcular o bien se puede comparar lo que se desea medir con un objeto o fenmeno similar. Ej. El sexo de la persona, la cantidad de palabras que es capaz de recordar. Estos son ejemplos de medicin directa. Indirectas- el fenmeno a medir no puede evaluarse en forma directa sino que se hace necesario el uso de un instrumento para materializarlo y de ese modo asignarle nmeros. Dentro de los fenmenos psicolgicos de medicin indirecta conviene distinguir dos tipos; Los fenmenos tangibles; como suelen ser variables fsicas o psicofsicas (ejemplo, tiempo que tarda un sujeto en resolver un problema). Los fenmenos intangibles, es decir que se infiere su misma existencia de los indicadores que se le atribuyen en su operacionalizacin. En el caso de las mediciones indirectas de fenmenos tangibles al error que se podra cometer con una medicin directa se le debe agregar el error que introduce el instrumento. Por ejemplo, si se mide el tiempo que tarda un sujeto resolver un problema deber agregrsele el error del reloj o cronmetro. Todo instrumento que se agregue a una medicin es una posible fuente de error que deber contemplarse.
23
Cuando las mediciones son indirectas y de fenmenos intangibles el error se maximiza. Al error cometido por el instrumento deber agregrsele el producido por en su operacionalizacin y validacin. En referencia a los instrumentos cualitativos o semi-cualitativos, interesa destacar cuatro aspectos a tener en cuenta en su proceso de construccin: 1. Cmo operacionaliza el constructo; relevar cuales son las conductas o cogniciones observables que den cuenta del mismo indicador, y lo distinguen de otros. 2. Como fomenta que las conductas a evaluar se manifiesten, y cmo se les asignan nmeros (cuantificacin) que representen ya sea su intensidad o frecuencia o, al menos, su presencia ausencia. 3. Cmo operar con nmeros para lograr, en lo posible, uno o pocos que sean la expresin cuantitativa y/o cualitativa ms acabada posible del constructo que se pretende medir (cuantificacin de conjuntos de respuestas). 4. Como transformar los nmeros obtenidos en resultados que sean significativos para su interpretacin. Lo que se intentar es poder establecer cmo se cuantifican los conjuntos de respuestas obtenido lo que se denomina puntaje bruto, y cmo se lo valora a travs de los denominados puntajes transformados y los baremos. Puntaje Bruto- Una prueba psicomtrica incluye la nocin de escalamiento, definido como la posibilidad de convertir o traducir las respuestas brindadas por los sujetos a una puntuacin. Y para que el conjunto de los nmeros representen a la variable psicolgica pretendida, se asigna a cada uno de los tems un numeral. Y una vez asignados esos numerales, es deseable operar sobre ellos en forma tal de obtener otros nuevos que tengan una significacin ms robusta e isomorfa con la variable que se quiere evaluar. As se determin que un conjunto de respuestas estn evaluando la misma variable, podramos por ejemplo sumar los nmeros que les asignamos a cada una de ellas a fin de obtener un nuevo valor que represente el total de dicho conjunto. A este nuevo nmero que sintetiza y representa la cantidad/ cualidad/ frecuencia de la variable y que ha sido el resultado del proceso de medicin, se lo suele denominar puntaje bruto, crudo o directo. El puntaje bruto es, entonces, un nmero que representa una cuantificacin de la variable o constructo a medir, es el resultado de la escala de medicin. El nivel de medicin del puntaje bruto guarda relacin con el nivel de medicin que posean los tems a combinar y con la forma de hacerlo. El valor resultante de una combinacin de tems suele mejorar el nivel de medicin que tiene el tem aislado El nmero resultante de agrupar tems suele tener, al menos, el nivel de medicin de los tems con que se compuso, y con frecuencia los supera. El puntaje bruto suele ser poco claro para la evaluacin por parte del usuario de la tcnica, ya que si bien cuantifica o cualifica el constructo, por s mismo no ofrece suficiente informacin con respecto a la magnitud de la medida obtenida. Para comprender si el puntaje bruto es alto, bajo o intermedio, se requiere de un sistema de referencia externo, generalmente una comparacin con los valores que comnmente obtiene los dems sujetos. Lo que se estila hacer para valorar el puntaje bruto es compararlo con otros
24
valores que permitan contextualizarlo (ejemplo, se podra sacar el promedio de las palabras memorizadas al evaluar la capacidad de memoria). Cuando estos valores se utilizan para convertir los puntajes brutos en otros, a los ltimos se los conoce como Puntajes Transformados, los cuales no son el producto de una escala de medicin, sino que se trata de nuevos nmeros, fruto de la comparacin de los puntajes brutos con referencias poblacionales. Estos nuevos nmeros no expresan cunto de la variable puntu el examinado, sino cunto puntu en relacin a los dems. Esta reconversin de un puntaje bruto a uno transformado ya no es una medicin en el sentido de la asignacin de nmeros al fenmeno que se quiere medir, ahora se trata de una conversin del nmero que realmente cuantifica al constructo (puntaje bruto) en otro ms til para interpretar (puntaje transformado). A su vez los puntajes transformados pueden clasificarse en dos grandes tipos; las medidas de posicin y los puntajes estndar: Medidas de posicin; Lo ideal para establecer las comparaciones y valorar el puntaje obtenido por un sujeto es hacerlo con los puntajes de la poblacin,, y los valores obtenidos de esos puntajes se los denomina parmetros. Pero en la gran mayora de los casos es muy poco prctico lograr obtener los puntajes de toda la poblacin para realizar dicha comparacin, ya sea porque sta es muy numerosa o porque es muy caro el proceso, por eso es necesario recurrir subconjuntos de dicha poblacin llamado Muestreo. Al calcular los estadsticos de estas muestras, se puede estimar los parmetros, y lo ms importante para que estos parmetros estn adecuadamente estimados, es haberlos calculados con muestras representativas de la poblacin, y al respecto es importante poder tener conocimientos sobre la validez de los resultados que se obtienen, y con ello asegurarse que el sujeto a examinar sea similar a los que conformaron la muestra, para obtener resultados ms ajustados desde un punto de vista mtrico y reducir el error de medicin. Una vez que se ha seleccionado la muestra, se administrar el instrumento en cuestin a todos sus integrantes, y se calculan los resultados obtenidos por cada uno de los sujetos. Con esos puntajes se calculan los estadsticos y se estima los parmetros. Se representan en una tabla que permite la conversin de los puntajes brutos a puntajes transformados. Dicha tabla recibe el nombre de Normas estadsticas o baremos. A la cantidad de casos correspondiente a cada uno de los distintos puntajes se las denomina frecuencia o frecuencia absoluta (nmero de casos) de dicho puntaje. Y se denomina frecuencia relativa a la frecuencia absoluta dividida la cantidad total de datos que conforma la muestra. A la frecuencia relativa se la multiplica por 100., obteniendo entonces la frecuencia relativa porcentual. Una manera de mejorar el ordenamiento de los datos cuando se trabaja con una variable de nivel ordinario, intervalar o de cociente, es utilizar las frecuencias acumuladas. Para ello se ordenan los resultados de menor a mayor y se calcula la frecuencia obtenida por cada uno de ellos. Se llamar frecuencia acumulada a la frecuencia que tiene un determinado puntaje ms las frecuencias que tienen todos los resultados menores a l, es
25
decir que se calculan la cantidad de datos que se hallaron con el valor en cuestin o con valores inferiores. Todos los puntajes transformados llamados medidas de posicin se basan en las frecuencias acumuladas porcentuales. Los ms destacados en psicologa son el percentil, el decil y el cuartil. Como se ha visto, la mediana es el valor que divide al conjunto de los datos en dos mitades con la misma cantidad de datos. Si se deseara dividir la distribucin en 100 partes, en cada una de las cuales se encuentre la misma cantidad de casos, hacen falta 99 valores. Esos puntajes que dividen la distribucin en 100 partes con el 1% de los casos en cada una de ellas se denomina percentil., y expresa qu porcentaje de mediciones de la muestra tiene por debajo o en el mismo valor cada puntaje bruto. Los deciles son puntajes anlogos a los percentiles, pero en lugar de tener un rango de 99 posiciones, tiene, uno de 9. Estos nueve valores son aquellos que dividen a los datos en 10 conjuntos de igual cantidad, y se obtiene tambin de las frecuencias acumuladas. Hay pocas escalas de medicin que los utilicen, siendo la ms destacada en nuestro medio el test que evala los factores de la personalidad. Los cuartiles son otra medida de posicin pero menos usual en evaluacin psicolgica, ya que sirven para dar resultados muy gruesos. Dividen los resultados solo en cuatro agrupamientos de igual cantidad de datos. En general son medidas que son ms tiles para trabajar con datos estadsticos o tomar decisiones sobre muestras, que en la construccin de instrumentos de evaluacin. Puntajes Estndar; estos puntajes se obtienen mediante un clculo matemtico por el que logra comparar el puntaje bruto evaluado en un sujeto con el valor medio y el desvo estndar previamente calculados en una muestra. Para explicar el concepto de puntaje estndar se parte de la distribucin de frecuencia llamada normal o campana de Gauss, y se obtienen de una frmula matemtica aplicada a los puntajes brutos, a cada uno de estos le corresponde un nico puntaje estndar. Para obtener el puntaje medio, llamado media o promedio, es necesario, primero, administrar el instrumento a una muestra de sujetos y obtener los puntajes de cada uno de los individuos que la componen. La media se obtiene sumando todos los puntajes y dividiendo el resultado de esa suma por la cantidad de sujetos evaluados. Si al puntaje bruto obtenido por un sujeto se le resta el valor de la media, se obtiene un nuevo puntaje cuyo valor indica cun apartado del valor promedio est el puntaje bruto en cuestin. Este nuevo puntaje que combina el puntaje bruto con la media se denomina puntaje diferencial, y tiene la propiedad de que cuanto ms grande es su valor, mayor ser la distancia del puntaje bruto respecto del valor promedio; y tiene la propiedad de que cuando el puntaje bruto vale cero, ste coincide con la media. Si el puntaje bruto de un sujeto fuera superior al valor promedio, el puntaje diferencial que le corresponder ser de un valor positivo. Por el contrario, si el puntaje diferencial es negativo, indica que el puntaje bruto es inferior al puntaje medio. La ventaja del uso de los puntajes diferenciales con respecto a los puntajes brutos es que le informan si la medida est por encima o por debajo de la media con solo ver su signo, tambin indican, con su valor absoluto qu tan lejos est del valor promedio.
26
Puntaje Z; Para superar las limitaciones que tiene el uso de la media como cociente para dividir los puntajes diferenciales, se usa, entonces, otro estadstico que toma en cuenta la dispersin que tienen los valores respecto de la media. Para obtenerlo se parte de los puntajes diferenciales que indican la distancia que tiene cada puntaje bruto respecto de la media, y un promedio de ellos sera un forma razonable de obtener una medida de cun dispersos o alejados estn estos valores. Este estadstico recibe el nombre de desvo estndar o desvo tpico, y es la raz cuadrada del promedio de los puntajes diferenciales elevados al cuadrado. Es una medida que vara de acuerdo a cuan dispersos estn los puntajes brutos respecto de la media. Si el valor es muy pequeo implican mayor lejana de los puntajes brutos con respecto al promedio. El uso del puntaje z tiene gran difusin en los instrumentos de evaluacin psicolgica, y por lo tanto, conviene conocer, algunas de sus propiedades; Cuando el puntaje bruto es una medicin es igual al valor de la media, z valdr cero, Si su signo es positivo entonces el puntaje bruto con que se calcul es mayor a la media, y si es negativo, es menor a la misma. El puntaje z es el puntaje transformado, llamado puntaje estndar, que puede obtenerse a partir de un puntaje bruto, cuando se conocen la media y el desvo estndar de los puntajes obtenidos previamente en una muestra. Este puntaje es un nmero que puede ser positivo o negativo, e indica cuan cercano o alejado al valor promedio de la muestra est el puntaje bruto. Puntaje T; Si bien el puntaje z, comparado al puntaje bruto, aporta indudables ventajas para la interpretacin, el hecho de que sus valores suelan tener decimales y, adems, que arrojen puntajes con signo positivo y negativo, complican su facilidad de lectura. Entonces, para simplificar la interpretacin de los puntajes estndar, nmeros instrumentos utilizan variantes de z, que pueden calcularse con simples operaciones matemticas. El puntaje T no es ms que el puntaje z al que se lo ha multiplicado por 10 y se le ha sumado un valor de 50. De esta forma, un valor de z=0 se convierte en un puntaje T=50. Con los puntajes T se logran perfiles ms acotados y fciles de leer, eliminando zonas de puntaje muy poco frecuente que no agregan significacin psicolgica. Puntajes CI; Las escalas de Weschler de inteligencia, para nios y adultos, cuyas versiones actuales son el WISC-IV y el WAIS III, expresan sus resultados principales en puntajes transformados, tambin derivados de z, llamados Coeficientes Intelectuales (pueden ser verbales, de ejecucin o de la escala completa) y Puntajes ndice. Todos ellos comparten las mismas caractersticas como puntajes transformados, usando una media de 100 puntos y un desvo estndar de 15. Con estos valores definidos, la forma de obtener los CI y los puntajes ndice es anloga al puntaje T, cambiando las constantes de 50 por 100 y de 10 a 15. Un CI de 100 puntos indica que el examinado ha obtenido un valor medio, un CI 115 se corresponde a un puntaje z= 1, es decir, un desvo estndar por encima de la media. Al igual que en los puntajes T, los valores muy alejados de la media son harto infrecuentes, ms si se tiene en cuenta que el Cociente intelectual tiene una distribucin normal. Con el objetivo de facilitar la lectura de los CI, las escalas Wechsler proponen rangos o intervalos de interpretacin, que se seleccionaron teniendo en cuenta la frecuencia con la que los sujetos pueden obtener distintos valores CI.
27
Adems de estas escalas, existe otro Test de Inteligencia muy difundido, el Test de Stanford Binet, que utiliza tambin puntajes CI. Estos son similares a los propuestos en los test de Wechsler, ya que utiliza un valor medio de 100 puntos, pero con un desvo estndar de 16 puntos. Puntajes Equivalentes; Las escalas de Wechsler obtiene su valor de CI y de puntajes ndice de una combinatoria de puntajes obtenidos a travs de los distintos sub-test que las componen. Cada uno de esos sub-test puede administrarse en forma independiente de los otros, y como resultado de la puntuacin de cada uno de ellos se obtienen los correspondientes puntajes brutos que se han de convertir en un puntaje transformado. Cada uno de estos puntajes transformados es tambin una variante del puntaje z llamado puntaje equivalente, con una media de 10 puntos y un desvo estndar de 3. Para lograr esto se igualan los puntajes equivalentes a los puntajes z. Confiabilidad y Error de medicin; La elaboracin de una tcnica psicomtrica implica, no slo seleccionar adecuadamente el tipo de puntuaciones que el instrumento ha de brindar, es necesario tambin proveer evidencia emprica evidencia emprica sobre la calidad de las mismas, lo cual se lleva a cabo poniendo a prueba la consistencia y precisin de los puntajes (confiabilidad). La confiabilidad es un ndice de la calidad de la tcnica de evaluacin, a cargo de quien elabora y adapta el instrumento en cuestin. Es necesario destacar que toda medicin se halla fundamentada en un teora de la medicin, la cual analiza distintas propuestas para describir, categorizar y evaluar la calidad de las medidas, y que a su vez, tiene como objetivos tanto mejorar su utilidad y su precisin, como desarrollar nuevos mtodos en la obtencin de instrumentos de mayor calidad. La medicin en Psicologa se analiza desde la ptica de la llamada Teora Clsica de los Test (TCT), denominada tambin Modelo del Valor Esperado. La TCT es una teora til para describir la influencia de los errores de medida en las puntuaciones observadas u obtenidas a travs de instrumentos, y sus relaciones con las puntuaciones verdaderas, se basa en el modelo lineal de Spearman el cual trata de la incertidumbre o error inherente a cualquiera de las medidas realizadas mediante la aplicacin de un test. Desde esta teora al realizar mediciones a los test, hay dos supuestos presentes; - Por un lado, existen puntajes verdaderos que reflejan puntualmente la realidad, que miden de un modo exacto, sin erro. - Y por el otro, que siempre que realizan mediciones, pueden cometerse errores. Si bien estos dos supuestos parecen contradictorios, uno responde a una hiptesis de trabajo sustentada por un supuesto ideal, se refiere a la una probabilidad terica. Se supone entonces puntuaciones verdaderas, sin error, y al mismo tiempo se supone que se realiza una medicin concreta del fenmeno, lo ms probable es que se cometan errores. Entonces la distincin entre un puntaje teorizado, al que llamaremos verdadero, y otro concreto, al que llamaremos obtenido, es fundamental ya que uno de los objetivos ms
28
importantes de la Psicometra es determinar el valor real o puntuaciones verdaderas, la cual se define como lo que queda de la puntuacin observada u obtenida a travs del test, una vez eliminado los errores de medida. En las mediciones indirectas de fenmenos intangibles, el puntaje verdadero no puede ser concretamente calculado, dado su carcter ideal. Se trata de un concepto al que se intenta acceder y del cual slo puede inferirse su valor hipottico. Por esta razn, el objetivo de los estudios que se realizan sobre la precisin de las puntuaciones obtenidas a travs de un instrumento es controlar y calcular el margen de error. Los tipos de error; Una medicin, realizada a travs de un instrumento psicomtrico, puede estar influida por fuentes de error tan diferentes y variadas, las cuales se pueden dividir en dos categoras segn el tipo de error que generen. Errores Sistemticos; Son aquellas que desplazan las puntuaciones en cierta direccin, generando una puntuacin sistemticamente elevada o baja. Suelen denominarse errores constantes Por ejemplo, una balanza que indica 1.5 kg ms, independientemente de que pese mal, siempre el error va a ser constante. El peso relativo de las personas permanece sin cambios. Se trata de un ejemplo que viene a mostrar que el error sistemtico, a pesr de introducir diferencias en el resultado de la medicin, no cambia la variabilidad, la distribucin de las puntuaciones de un grupo de sujetos en la variable que se est evaluando. Los errores sistemticos pueden ser detectados a travs del anlisis de la validez del instrumento. Los estudios sobre la confiabilidad se ocupan de los errores asistemticos Errores Asistemticos; son aquellos sin posibilidad de ser controlados, impredecibles o aleatorios, ya que son generados por las variaciones cuya causa es el azar. Las tcnicas psicomtricas son instrumentos estandarizados, lo cual implica, entre otras cuestiones, uniformidad en el proceso de administracin y de evaluacin, ya que las variaciones en los procedimientos daran lugar a variaciones en las respuestas no atribuibles a la variable que se desea medir. Sin embargo, aunque las pautas de aplicacin y evaluacin, sealadas por el autor en el manual de la tcnica, a aplicar, sean respetadas, al llevar a cabo una medicin siempre existen factores o condiciones azarosas que pueden generar errores. Dichas fuentes de error pueden haber sido generadas en la etapa de construccin de la tcnica, en la administracin, en la puntuacin y en la interpretacin de los resultados arrojados por la misma. En cuanto a las fuentes que pueden generar error durante la etapa de construccin de un instrumento, una de las posibles es la del muestreo de contenido, y que se refiere a la variacin en los resultados obtenidos dependiendo de los tems incluidos en la tcnica. Las fuentes de error que pueden ocurrir durante la administracin de la tcnica son aquellas que tienen cierta influenciabilidad en cambios azarosos en la atencin o motivacin del sujeto examinado (desgano, ansiedad, experiencias anteriores);
29
las variables relacionadas con las condiciones ambientales (temperatura, ventilacin, ruido, iluminacin), y las variables relacionadas con el examinador (su estilo, su comportamiento). Y la subjetividad del evaluador, que no debe estar implicada en la puntuacin, ya que la misma puede constituirse tambin en una fuente de error. Se deben analizar muy bien las instrucciones para evaluar la tcnica y la claridad de los criterios de evaluacin. Estos ejemplos sealan algunas condiciones que pueden influir durante la administracin, pero las situaciones son innumerables y las reacciones de los examinados frente a estas influencias pueden constituir una fuente de error en la medicin de la variable en cuestin. Confiabilidad de las puntuaciones; La palabra confiabilidad presenta ciertas especificaciones en el contexto de la psicometra. Hay varias definiciones de que es la confiabilidad; Por un lado, se seala que estudiar el concepto de confiabilidad implica analizar el grado de la determinacin de la precisin con la que se realiza la medida. Es decir que el concepto de confiabilidad es anlogo para otra literatura cientfica, a la denominacin de precisin. Por otro lado, se llama confiabilidad a la tendencia de un objeto o un sujeto o una tcnica a la consistencia en un conjunto de medidas de un atributo. Confiabilidad de un test se refiere a la consistencia, o mejor dicho a la coherencia de los puntajes obtenidos por los mismos individuos en distintas ocasiones o con diferentes conjuntos de tems equivalentes. Una definicin establece que el trmino confiabilidad se refiere a la proporcin de la varianza total de las puntuaciones obtenidas con un test que puede atribuirse a la varianza verdadera. Cuanto mayor es esta proporcin, ms confiable es la tcnica. Por ltimo, la confiabilidad se refiere a la consistencia de las puntuaciones obtenidas por las mismas personas cuando se las examina en distintas ocasiones con el mismo test, con conjuntos equivalentes de tems o en otras condiciones de administracin. El concepto fundamenta el clculo del error de medicin de un solo resultado, con el que podemos predecir la probable fluctuacin en la calificacin de un solo individuo debida a factores aleatorios irrelevantes o desconocidos. De esta ltima definicin se desprende que, cuando se mide un atributo psicolgico resultar afectada por cierta cantidad de error aleatorio. Para comprender aquellas cuestiones relacionadas con la confiabilidad se debe tener presente algunas nociones relacionadas con los conceptos estadsticos: Varianza y Desvo estndar: Ambos conceptos son utilizados en el estudio de la dispersin de los puntajes obtenidos a travs de la aplicacin de una tcnica a una muestra de sujetos.
30
El desvi estndar fue explicado junto con el tema de validez (Es una medida que vara de acuerdo a cuan dispersos estn los puntajes brutos respecto de la media), y la varianza se refiere a otra medida de la variabilidad, que responde a la pregunta cmo estn diseminadas las puntuaciones obtenidas? Mide la dispersin de los datos con respecto a la media, y queda definida como la suma de los cuadrados de las diferencias entre los valores de la variable y la media, ponderados por sus respectivas frecuencias. La varianza puede ser definida tambin, como el promedio de las desviaciones al cuadrado respecto a la media del grupo. Sampieri a su vez propone definirla como la fluctuacin o variabilidad promedio de un determinado valor de la poblacin. Siempre que un instrumento de medicin es aplicado a un grupo de individuos se obtiene una distribucin resultante, los individuos asumen diferentes valores de la variable, y la variabilidad que encontramos en el conjunto de puntuaciones obtenidas pueden expresarse como su varianza, siendo la raz cuadrada de sta su desvo estndar. La varianza total en una distribucin de puntuaciones obtenidas en una prueba es igual a la suma de la varianza verdadera ms la varianza de error. El desafo para el autor o adaptador de una tcnica de avaluacin psicolgica es maximizar la proporcin de la varianza total que es la varianza verdadera, y minimizar la proporcin de la varianza de error. De este modo se acercar ms a las puntuaciones verdaderas del atributo en cuestin. Coeficiente de correlacin; Se trata de un concepto estadstico fundamental para comprender los procedimientos empricos a travs de los cuales se valora la calidad de una tcnica psicomtrica. Expresa el grado de correspondencia o relacin, o covariacin, entre dos conjuntos de puntuaciones. Permite establecer el grado entre dos variables o entre una variable y un conjunto de otras variables, pero siempre es bivariada. Se utiliza cuando las medidas sean del nivel de intervalos o de razn, y cuando la hiptesis a probar es correlacional, del tipo A mayor que X, altos valores A estn asociados con altos valores de X. Cuando la correlacin entre dos variables es perfecta, el coeficiente de correlacin es igual a 1, cuando no existe asociacin alguna, es cero. Por lo tanto el coeficiente de correlacin se calcula a partir de las puntuaciones obtenidas en una muestra de dos variables. Relaciona las puntuaciones obtenidas de una variable, con las puntuaciones obtenidas en otra variable, en los mismos sujetos. Si bien hay varios coeficientes de correlacin, el que se utiliza con ms frecuencia, por adecuarse a las caractersticas de las variables psicolgicas, es el coeficiente de correlacin lineal de Pearson. Las correlaciones son afectadas por la variabilidad del grupo en que fueron calculadas. Conforme disminuye la variabilidad de la muestra, tambin lo hace el coeficiente de correlacin. Coeficiente de confiabilidad; Las bandas psicomtricas de un instrumento, como ya fuera dicho, vienen expresadas por su confiabilidad y por su validez. Cada una de ellas tiene una manera tcnica de expresin. En este caso, se trata de un nmero que indica en qu medida una tcnica es confiable, y esa forma tcnica de expresin es el coeficiente de confiabilidad, y la forma natural de obtenerlo es calculando la proporcin (la razn o cociente) entre la varianza de la puntuacin verdadera en una prueba y la varianza total.
31
De esta forma, el coeficiente de confiabilidad se obtiene calculando el cociente entre la varianza verdadera y la varianza total. El coeficiente de confiabilidad es un nmero cuyo valor mnimo es cero, lo cual estara indicando la inexistencia de varianza verdadera, ya que todo es varianza de error, y su valor mximo es igual a 1, lo cual estara indicando que no hay error. Entonces, cuanto ms cercano a uno sea el valor del coeficiente de confiabilidad, ms confiable ser el instrumento del cual se obtuvieron las puntuaciones, por el contrario, cuanto ms cercano a cero es dicho coeficiente, menos confiable ser el mismo. La dificultad principal para calcular la confiabilidad, es que el nico dato que se puede obtener de los resultados de la medicin corresponde a la varianza total, mientras que la varianza verdadera como la de error, son incgnitas. Por tal motivo a esta forma de calcular la confiabilidad se la denomina forma terica, y al coeficiente obtenido se lo llama coeficiente de confiabilidad terico, ya que de los tres datos de la frmula hay dos que son desconocidos. De esta forma, la confiabilidad deber hallarse de alguna otra forma, a partir de mtodos empricos, y no con la aplicacin directa de la formula. Los procedimientos empricos para estimar el coeficiente de confiabilidad; tipos de confiabilidad; Si en dos ocasiones se administra una tcnica a un mismo grupo de sujetos, obtenido de este modo dos conjuntos de medidas, el instrumento pocas veces proporcionar exactamente el mismo resultado, y esto es debido a la incidencia de factores aleatorios. En algunos casos las discrepancias sern grandes, en otros casos menores, pero casi siempre estar presente. El hecho de que las mediciones repetidas a los mismos sujetos nos muestren exactamente los mismos resultados revela la falta de confiabilidad en el instrumento. Es decir, cuanto ms grandes sean las discrepancias entre la primera y la segunda medicin, menor ser la confiabilidad en el instrumento y mayor el error. Y las coincidencias entre las mediciones repetidas, va a estar representada por la varianza verdadera. En consecuencia, se ha diseado varios mtodos que permiten calcular el coeficiente de confiabilidad, que sin recurrir a la formula terica, toman en consideracin las discrepancias entre el primer conjunto de datos, producto de una medida, y un segundo conjunto de datos, producto de otra medicin, ambas realizadas a los mismos sujetos, y dichas discrepancias guardan relacin con la varianza de error. Los diferentes mtodos que permiten calcular empricamente el coeficiente de confiabilidad, y cada uno de ellos, de acuerdo a las caractersticas del diseo, permite delimitar de manera adecuada algn aspecto sobre la confiabilidad de los puntajes arrojados por la tcnica de medicin en cuestin. Los mtodos son clasificados de diferente manera, y cada uno de ellos involucra diferentes pasos para hallar el coeficiente de confiabilidad, pero en todos los procedimientos, como se ver ms adelante, es necesario disponer de al menos dos conjuntos de medidas paralelas de los mismos sujetos, para luego calcular entre ellas, el coeficiente de confiabilidad de la tcnica. En todos los casos se administra una tcnica de evaluacin psicolgica a una muestra de individuos, y de este modo se obtiene una
32
variedad de puntajes. Recordemos que aqu interesa analizar la variabilidad de las puntuaciones obtenidas por una muestra de sujetos, y no el puntaje obtenido por un solo sujeto. El objetivo de estos estudios es analizar la dispersin de los puntajes que arroja la tcnica administrada a un grupo de personas. Clsicamente se calcula la covariacin de dos variables diferentes, sin embargo nada impide que los dos conjuntos de datos provengan de una misma variable. Por lo tanto, se puede calcular tambin la correlacin entre el conjunto de datos provenientes de una primera medicin y de una segunda, siendo la misma variable la que sea evaluada en ambas ocasiones. En tal caso el coeficiente de correlacin indica la consistencia entre los puntajes obtenidos en ambas medidas; y ntese que esto es justamente lo necesario para analizar la confiabilidad de las puntuaciones. En consecuencia, se comprende que la correlacin entre dos conjuntos de medidas del mismo constructo es una buena medida del coeficiente de confiabilidad, ya que es un nmero que cuando vale cero indica absoluta discrepancia entre los valores de la primera y segunda medida, y cuando vale uno, una absoluta concordancia. Es por ello que la confiabilidad, desde el punto de vista prctico, se calcula con el coeficiente de correlacin de Pearson. Hay que destacar que mientras que el coeficiente de correlacin de Pearson puede asumir valores entre -1 y +1, el coeficiente de confiabilidad solo asume valores entre 0 y +1. Es muy poco probable, y psimo indicador de consistencia, ya que una correlacin entre dos medidas de la misma variable en los mismos sujetos resulte con valores negativos, y en tal caso se deber considerar que el instrumento no es confiable, que es lo mismo que decir que su confiabilidad vale cero. Mtodos basados en medidas repetidas; Es importante que un test arroje mediciones estables en el tiempo. Y una forma de estimar la confiabilidad de un instrumento de medicin consistente en usar un mismo instrumento en una muestra de sujetos, en dos momentos, es decir, con un lapso de tiempo entre ambas administraciones. Con este mtodo se estima el coeficiente de confiabilidad que permite medir la estabilidad de las puntuaciones obtenidas por la tcnica de evaluacin bajo estudio. En esta categora encontramos; Test- retest; El objetivo de este mtodo es medir la estabilidad de las puntuaciones sabiendo que conforme transcurre el tiempo las personas cambian. Pero Se trata de un cambio real en la variable o se trata de un cambio en el puntaje debido a la falta de confiabilidad, a la inestabilidad de las puntuaciones arrojadas por el instrumento, a su sensibilidad a las fluctuaciones aleatorias? La fuente de falta de confiabilidad que identifica al mtodo test-retest son las fluctuaciones temporales aleatorias, que influyen tanto en las condiciones de administracin como en las condiciones de los examinados. En este procedimiento emprico es fundamental la determinacin de la extensin del intervalo de tiempo entre una administracin y la otra, ambas realizadas en una misma muestra de sujetos.
33
La opcin que tome el autor o adaptador debe estar basada en el conocimiento de la evolucin de la misma a travs del tiempo, y una complicacin que puede surgir a travs de la toma de dicho test es que el mismo instrumento no evale lo mismo en dos puntos diferentes del tiempo. Cuando el intervalo de tiempo es breve pueden intervenir factores tales como la experiencia previa con los tems del test, la falta de novedad, la memoria, la fatiga o la falta de motivacin, y por lo tanto la segunda aplicacin ya no conserva las caractersticas de la primera. Por otro lado, por mltiples factores, conforme se incrementa el intervalo de tiempo transcurrido entre las aplicaciones del mismo test, la correlacin entre las puntuaciones obtenidas en cada administracin tiende a disminuir. Por lo tanto el autor o adaptador de la tcnica debe explicitar claramente los criterios de seleccin del intervalo de tiempo entre ambas administraciones., ya que solo as podr ser interpretado de modo adecuado el valor del coeficiente de confiabilidad. Las etapas del mtodo test-retest son; 1. Aplicar y evaluar la tcnica a una muestra de sujetos 2. Lapso de tiempo (justificado) 3. Aplicar y evaluar la tcnica a la misma muestra de sujetos 4. Calcular la correlacin entre las puntuaciones obtenidas en ambas ocasiones 5. Interpretar el coeficiente hallado (la estabilidad temporal de las puntuaciones). Formas paralelas o alternativas (con intervalo); Es utilizado cuando se necesita minimizar el efecto de la memoria del contenido de otra prueba aplicada con anterioridad. Es decir, es una buena alternativa cuando no se puede aplicar el mtodo test-retest por efecto que el aprendizaje y la memoria tendran sobre los resultados en la segunda administracin. Se procede entonces a elaborar formas equivalentes y se las aplica a los mismos sujetos en dos oportunidades, con un intervalo de tiempo ente ambas administraciones. En este mtodo es tan importante, como en el anterior, justificar el lapso de tiempo, la magnitud del intervalo. Al aplicar este procedimiento emprico no se administra el mismo instrumento de medicin sino dos formas equivalentes, una en cada sesin. El autor del test debe elaborar una tcnica y otra equivalente, su forma paralela. Estas formas paralelas deben ser similares en contenido, instrucciones y duracin, pero tambin deben ser equivalentes, tanto en las medias y las varianzas de las puntuaciones que arrojan, como en los ndices de dificultad y discriminacin de los tems. Entonces, este procedimiento controla dos fuentes de falta de confiabilidad, las fluctuaciones temporales aleatorias, y adems la inconsistencia de las respuestas a diferentes muestras de tems, ya que hay cambios en los reactivos del instrumento administrado en la primera sesin y en la segunda sesin. Las etapas del mtodo de formas paralelas son; 1. Administracin de una forma de test a una muestra de sujetos
34
2. Lapso de tiempo (justificado) 3. Administrar la forma paralela del test a los mismos sujetos 4. Calcular la correlacin entre las puntuaciones obtenidas con una y otra forma 5. Interpretar el coeficiente hallado. Mtodos basados en una sola aplicacin del test: los mtodos que implican la administracin de la tcnica en una muestra en un momento determinado, son las ms utilizadas por los autores y adaptadores de las tcnicas psicomtricas. Divisin por mitades; Este mtodo tiene como objetivos el examen de los tems que conforman la prueba u el anlisis de las relaciones entre ellos. El procedimiento emprico aporta la informacin para estimar el grado de consistencia interna del instrumento, es decir, controla e identifica la inconsistencia de la muestra de tems, el muestreo de contenido. Es condicin para ello que la tcnica en estudio sea homognea, que evale un nico atributo o factor. Requiere de una sola aplicacin del test a una muestra de sujetos, luego de lo cual se procede a dividir la prueba en mitades homogneas, apareadas en contenido y dificultad. La divisin tiene diferentes formas para lograr dos mitades homogneas; Una forma aceptable es asignar cada tem, a una mitad o a la otra, al azar. Otra modalidad, consiste en dividirlos en nmeros pares e impares, de modo que los tems queden ordenados segn su dificultad creciente, ya que de no usar este criterio, al segmentar un instrumento de 20 reactivos en dos mitades formadas por los primeros 10 y otra integrada por los ltimos 10, quedara una mitad del test con los tems de baja dificultad y la otra, solo con los difciles. Otra alternativa es dividir la prueba por contenidos, de modo que cada mitad del test contenga tems equivalentes en cuanto al contenido y la dificultad. A su vez las mitades deben ser similares en cuanto a formato, nmero de tems y estadsticos (media, varianza, ndice de dificultad y discriminacin). Las etapas involucradas en el mtodo de divisin por mitades son; 1. Aplicar la tcnica a una muestra de sujetos 2. Dividir el conjunto de tems en dos mitades homogneas 3. Calcular la correlacin entre las puntuaciones obtenidas en las dos mitades en las que ha quedado dividida la tcnica 4. Ajustar la confiabilidad de la mitad de la prueba usando la formula Spearman-Brown 5. Interpretar el coeficiente hallado. Formas paralelas o alternativas (sin intervalo): Este mtodo es similar al de Formas paralelas o alternativas con intervalo de tiempo, la diferencia reside en que en este procedimiento no hay un lapso de tiempo que separe ambas
35
administraciones. Se aplican ambas formas en la misma sesin, en la misma muestra de sujetos, una despus de la otra Este procedimiento controla especficamente si razones azarosas en la seleccin de los tems de cada una de las formas ha influido en la muestra de sujetos de tal manera que los mismos contestan mejor en una forma especfica del test que en la otra, y esto obviamente, no es funcin de variaciones verdadera en el constructo a evaluar, sino tan solo debido a que los tems particulares que le tocaron en suerte, o sea por azar, se deben a la influencia de errores aleatorios. El procedimiento de este mtodo consiste en las siguientes etapas: 1. Aplicar las dos formas a una muestra de sujetos 2. Calcular la correlacin entre las puntuaciones obtenidas por la misma muestra en una y otra forma 3. Interpretar el coeficiente hallado Se debe tener en cuenta que las aplicaciones de ambas formas, sin intervalo de tiempo, pueden ser afectadas por la fatiga y/o la falta de motivacin por parte de los sujetos, y por otro lado, se debe contemplar las diferencias que pueden deberse al orden de aparicin de cada una de las formas. Frmulas Kuder-Richardson; Se trata de ndices tiles para para evaluar la homogeneidad del test. Estas frmulas permiten calcular el grado de correlacin entre todos los tems de una escala. Se mide mediante el coeficiente KR-20. Se trata de variantes del coeficiente de correlacin de Pearson. Se selecciona este estadstico cuando se desea determinar la consistencia ente tems dicotmicos, sobre todos aquellos tems que pueden ser calificados como correctos o incorrectos. Y el mtodo identifica la inconsistencia ente los tems, la cual puede estar influida por el muestreo de contenido o por la heterogeneidad del atributo evaluado. Sus etapas son; 1. Aplicar y evaluar la tcnica a una muestra de sujetos 2. Calcular el coeficiente KR-20 entre los tems 3. Interpretar el coeficiente hallado. Coeficiente Alfa de Cronbach: puede ser utilizado en reactivos no dicotmicos o sea, en tems que incluyen un rango de alternativas posibles para que el sujeto los responda. El coeficiente alfa, resulta muy ventajoso y es ampliamente utilizado, en la actualidad, es el estadstico preferido para obtener una estimacin de la confiabilidad de la consistencia interna Puede considerarse como la media de todas las correlaciones de divisin por mitades, que luego sern corregidas por la frmula de Spearman-Brown. Las etapas son: 1. Aplicar la tcnica a una muestra de sujetos 2. Calcular el Coeficiente alfa entre las puntuaciones obtenidas por los distintos tems 3. Interpretar el coeficiente hallado
36
Confiabilidad entre evaluadores: una tcnica psicomtrica confiable debe arrojar los mismos resultados independientemente de quien lleve a cabo la evaluacin, ya que la medicin es estandarizada e implica uniformidad en las condiciones de administracin como en las de evaluacin. Numerosas tcnicas puntan de manera directa y objetiva, pero en ocasiones, el autor debe analizar si la tcnica cumple con el requisito de objetividad (o de incidencia mnima de la subjetividad del evaluador). Por lo tanto este mtodo identifica las fluctuaciones en las puntuaciones segn el evaluador. Sus etapas son; 1. Administracin de la tcnica a una muestra de sujetos 2. Evaluar las tcnicas administradas (evaluador A) 3. Evaluar las tcnicas administradas (evaluador B) 4. Calcular la correlacin entre los puntajes asignados por el evaluador A y B 5. Interpretar el coeficiente hallado Se evala la confiabilidad interexaminador, se analiza la concordancia entre los evaluadores. Por lo tanto, la utilidad del coeficiente de confiabilidad es til para conocer ciertas propiedades psicomtricas en una tcnica, para valorarla, para tener criterios de seleccin entre instrumentos, y tambin para calcular el error de medicin de las puntuaciones obtenidas a travs de la misma e interpretarlas adecuadamente. Error tpico de medida; su utilidad El administrador del test debe conocer el error que comete al realizar una medida, y es el coeficiente de confiabilidad lo que permite calcularlo. El error tpico en cuanto a la confiabilidad es importante a la hora de interpretar puntuaciones individuales, y ya no se analiza la variabilidad de las puntuaciones obtenidas en una muestra de sujetos para estudiar el instrumento, sino que se aborda el anlisis de una puntuacin especfica de un sujeto concreto. Como ya se ha dicho, en la prctica es muy poco frecuente que una medicin sea perfecta, generalmente tiene algn grado de error. En sentido amplio el error se refiere al componente de la puntuacin obtenida por un sujeto en una tcnica psicomtrica, que no est en relacin con la evaluacin del atributo en cuestin. Ms aun no se puede saber si el puntaje obtenido subestima o sobredetermina al atributo evaluado. Es decir que el error se refiere al componente de la puntuacin observada que est evaluando dichas variables improcedentes, condiciones aleatorias y no permanentes del atributo en cuestin. La confiabilidad es un dato que puede ser calculado a partir de algunos de los procedimientos empricos descriptos, mientras que la varianza de los puntajes, es un dato que puede calcularse. Cuanto mayor sea el coeficiente de confiabilidad, menor serpa el error tpico de medicin. Por el contrario, si la confiabilidad fuera igual a cero, entonces el desvo estndar del error sera igual al de la variable medida, es decir, todo sera error. Entonces, como no se puede calcular el error de una determinada medicin, sin embargo, calculando el desvo estndar de los errores se puede conocer la posibilidad de que el error se encuentre entre dos determinados y calculados valores.
37
A estos dos valores, uno por encima del puntaje obtenido y otro por debajo del mismo, con su correspondiente probabilidad, se los conoce como intervalo de confianza. Entonces, si bien el desvo estndar no permite precisar cul es el error que se comete en una determinada medicin, permite sin embargo calcular los valores de los intervalos de confianza, es decir, estimar con una determinada probabilidad entre qu puntajes estara el valor verdadero. En vistas de esta utilidad, el desvo estndar de error se lo denomina como error estndar o erro tpico. O sea que el error tpico permite estimar el rango de la puntuacin verdadera, entre las cuales se encontrar cierto grado de probabilidad, el puntaje verdadero del sujeto. Confiabilidad de las diferencias; En la prctica profesional, con frecuencia es necesario considerar dos tipos de diferencias, las interpersonales, cuando se comparan las puntuaciones obtenidas por dos sujetos diferentes, y las intrapersonales, cuando se comparan los puntajes obtenidos por un mismo sujeto en dos o ms variables psicolgicas. Pero cmo saber si las diferencias entre los puntajes obtenidos son debido al error de medicin o reflejan diferencias reales en el atributo evaluado. Estas cuestiones implican la necesidad de analizar si las diferencias existentes entre distintas puntuaciones se deben al azar o a caractersticas del sujeto en la variable de inters. Esto lleva a otra pregunta Qu distancia deben presentar entre si los puntajes obtenidos ara que efectivamente den cuenta de una diferencia real en el atributo evaluado? En principio, hay que tener presente que el error tpico de la diferencia de dos puntuaciones en mayor al error de medida de cualquiera de las dos, puesto que esta diferencia se halla afectada por los errores aleatorios presentes en ambas puntuaciones. mico y tico. El anlisis de las equivalencias: El inters por el efecto de las diferencias culturales en la evaluacin psicolgica y el uso de las tcnicas psicomtricas es importante. Se denomina ticos a aquellos constructos o aspectos, ideas e instrumentos, que tienen y que han demostrado caractersticas universales, mientras que los aspectos denominados micos son aquellos vinculados o utilizables en slo uno o en pocos grupos culturales. Por lo tanto estos conceptos son importantes a la hora de analizar el grado de universalidad del constructo o instrumento en cuestin y de demostrarlo con datos empricos. As como por ejemplo un constructo como inteligencia tiene un importante valor tico, debido a su universalidad, en casi todas las culturas existe alguna concepcin de la capacidad de los sujetos, pero tambin posee alguna valoracin distintiva de cada cultura en particular (valor mico). La ciencia ha dado un valor destacado a la universalidad de los hallazgos, y por ello la importancia que le da a la valoracin tica; no obstante, en los ltimos aos, numerosas investigaciones transculturales han ido demostrando la falacia del valor tico de muchas teoras y constructos que se suponan tales, rescatndosele su valor mico. Es decir que cuanto mayor valoracin tica tiene un constructo ms universal es, pero es muy poco probable que no tenga un componente mico, que al trasladarlo a otra cultura no haya que hacer conversiones y equivalencias para valorarlo o utilizarlo en su justa medida.
38
Se proponen tres tipos de equivalencia a tomar en cuenta en esta adaptacin de un constructo; Las equivalencias conceptuales; que se refiere a si el constructo existe en la cultura donde se desea utilizar la tcnica en cuestin, y en tal caso si la forma de valorarlo es la misma que en la cultura de origen. Esto lleva a su vez a preguntarse sobre la validez cultural del constructo y del instrumento que lo mide, si los constructos tiene los mismos indicadores en la cultura de origen que en la que se adapta el test. Lingsticas; que se refiere a la redaccin de los tems y consignas, a su traduccin y al empleo de trminos que tengan significados iguales o lo ms parecidos posibles a los originales. Hay que tener en cuenta en las traducciones los giros idiomticos, la idiosincrasia, las creencias y los valores puestos en juego en los reactivos. Para realizarla, se suele recurrir a las traducciones por consenso (varios expertos). Mtricas; esta adaptacin se refiere al calibrado, tanto al valor con que se pondera cada tem, como a la adecuacin de las normas, la revaluacin de los estudios de confiabilidad y de validez y la revisin de la cantidad de factores que componen el instrumento entre otras posibilidades. Formato; Se refiere a los aspectos formales del instrumento que puedan afectar la forma de responder de los sujetos, como ser la utilizacin del tiempo, el tipo de formato de las respuestas. Un aspecto a destacar cuando se hacen las equivalencias es el referido a cmo afecta el tipo de la respuesta llamada deseabilidad social, entendiendo como tal la tenencia de los sujetos a contestar los tems de acuerdo a lo que es esperable que responda desde una perspectiva de valoracin social, y no en virtud de cmo realmente es o lo que le sucede. En sntesis, se requiere establecer la validez cultural del constructo, la validez lingstica y/o grfica de su expresin en el test, la validez del formato seleccionado y la validez mtrica.
Unidad II: La Evaluacin psicolgica en nios. 1) La mini batera Koppitz: Bender, figura humana, VADS. Es una mini batera porque incluye pocas tcnicas. Se dice que es psicoeducacional porque es importante en el rea educativa y en perodo reducido de tiempo, le aporta muchos datos al maestro sobre el nio que va a iniciar la escuela primaria. La mini batera Incluye 3 tcnicas que se complementan e integran en la medida en que cada una evala distintas estrategias cognitivas permitiendo a su vez acceder a aspectos no cognitivos del sujeto. Se utiliza en nios que estn entre los 5 y y los 13 aos. Adems, puede ser administrada a sujetos de culturas diferentes, siempre y cuando se tengan en cuenta a la hora de hacerlo, las adaptaciones necesarias:
39
La construccin de baremos correspondientes a la regin en cuestin, para poder hacer la comparacin de los puntajes obtenidos por los individuos examinados y sus poblaciones de referencia (poblaciones que compartan cultura, edad, sexo, etc.). Equivalencias conceptuales: Teniendo en cuenta el contenido y el concepto del constructo. Equivalencias lingsticas: Considerar las diferencias lingsticas entre los distintos pases.
Dentro del diagnstico psicoeducacional, la mini batera Koppitz resulta til en una primera aproximacin para el despistaje (screening) de dificultades en el aprendizaje escolar. Por otra parte, posibilita la evaluacin de estrategias cognitivas (visuales, auditivas y graficas) en forma independiente o combinada; informacin til a los fines educacionales dado que nos muestra en cuales de ellas existen mejores niveles de logros. Tambin tiene validez emprica para discriminar entre el alumno con problemas para el aprendizaje del que no lo posee. Por ltimo, puede tener validez predictiva respecto a la forma de resolver situaciones de aprendizaje futuras y secundariamente puede brindar informacin sobre la presencia de ansiedad. 1. El Bender es una tcnica que contiene nueve figuras que son presentadas de a una por vez para ser copiadas (en un tiempo normativo que vara de acuerdo a la edad y la zona). La puntuacin es a partir de treinta tems de maduracin que se computan como uno o cero, es decir, por la presencia de desvo de la norma (1) o ausencia de tal desvo (0). Luego, se calculan percentiles como puntaje transformado. Wertheimer haba usado originalmente esos diseos para demostrar los principios de la Psicologa de la Guestalt en relacin a la percepcin. Bender adapt estas figuras y las us como test viso-motor. Con este proceder, aplic la teora de la Guestalt al estudio de la personalidad y la prctica clnica (Marco terico). El Bender est relacionado con la capacidad del sujeto para reproducir estructuralmente patrones visuales que percibe en forma simultnea. Es de aplicacin individual y mide tres variables: Madurez viso-motriz (coordinacin ojo mano). Variable grfica (cmo dibuja, pero sin tener en cuenta su calidad artstica). Variable de lecto-escritura. A partir de esta tcnica se puede detectar alguna disfuncin neurolgica (ojo-mano) o el grado de ajustes emocionales. Cabe aclarar que el Bender es un test (adems de una tcnica). La tcnica que no es test compara las caractersticas de una persona o grupo con lo que postula un criterio o constructo y solo tiene en cuenta la presencia - ausencia de la variable. El test es un tipo de tcnica psicomtrica que supone una situacin estandarizada y estima diferencias individuales en relacin con datos estadsticos
40
(baremos). Ubica a un individuo en relacin con un grupo de semejantes de forma objetiva y estandarizada. Entonces, todo test es una tcnica psicomtrica, pero no todas las tcnicas psicomtricas son tests. Para desarrollar un estudio de validez concurrente con el Bender se debe administrar, adems de dicha tcnica, otra tcnica que evale el mismo constructo (coordinacin visomotora) como por ejemplo alguno de los subtests de ejecucin del Wisc III (Claves o Construccin con cubos). Luego se deben analizar las correlaciones entre los puntajes de ambas tcnicas. En el caso de desarrollar un estudio de validez predictiva con el Bender, se debe partir de los puntajes obtenidos. De esta manera es posible predecir los futuros logros o capacidades de los alumnos en la escuela primaria. Si se obtuvo un buen resultado al comienzo de la escolaridad se puede predecir con bastante seguridad un buen rendimiento escolar. A modo descriptivo, se pueden sealar algunos indicadores emocionales del test y su significacin psicolgica: Orden confuso: Cuando las figuras estn desparramadas arbitrariamente en el papel, sin secuencia ni orden lgico, indica planeamiento pobre e incapacidad para organizar el material. Es comn en nios de 5 a 7 aos, pero se relaciona con confusin mental en nios mayores. Repaso del dibujo o de los trazos: Todo el dibujo o partes del mismo es repasado con lneas espesas. Se asocia con cierta impulsividad y agresividad. Se da frecuentemente en los nios con conductas acting-out. Gran tamao: Uno o ms de los dibujos es un tercio ms grande en ambas direcciones que en el de la tarjeta de estmulo (este tem se punta solo una vez independientemente de la cantidad de figuras que han sido agrandadas). Se asocia con nios con la conducta del acting out (nios con problemas emocionales). Tamao pequeo: Uno o ms dibujos son la mitad ms pequeos que el modelo (este tem se punta solo una vez independientemente de la cantidad de figuras que han sido reducidas). Se asocia con ansiedad, timidez y retraimiento. Lnea fina: El trazo es tan fino que hay que esforzarse para ver el dibujo completo. Se asocia con timidez y retraimiento. 2. El DFH (dibujo de la figura humana) es un indicador de la madurez conceptual que posee el nio, esto es, la habilidad para formular conceptos de abstraccin creciente. Evala: La evolucin de la madurez intelectual (habilidad para desarrollar conceptos con mayor grado de abstraccin. El dibujo es un ndice del concepto que del objeto tiene el nio).
41
Posibles disfunciones neurolgicas. Ajuste emocional. La tcnica consiste en doblar una hoja como un cuadernillo, y pedirle al nio que dibuje un hombre al frente, una mujer en la cara izquierda del otro lado y que se dibuje a si mismo en la cara derecha. La forma de puntuacin es igual que en el Bender. La presencia de los tems evolutivos en un DFH se relaciona especialmente con la edad y la maduracin del nio y no con la aptitud artstica o aprendizaje escolar. El nivel evolutivo de esta tcnica corresponde a la edad cronolgica de los sujetos, independientemente del grado de entrenamiento escolar recibido. Para realizar un estudio de confiabilidad con el DFH se podra utilizar el mtodo de test retest, el cual consiste en repetir la toma en una segunda oportunidad (se sugiere que el intervalo de tiempo entre las dos tomas no sea mayor a 6 meses). Este procedimiento nos permite hablar de la estabilidad de las mediciones obtenidas administrando una tcnica psicomtrica. Otro estudio de confiabilidad se podra realizar utilizando el mtodo de formas equivalentes, en el cual se preparan dos formas distintas de la tcnica de evaluacin, se las administra y luego se calcula la correlacin entre los puntajes obtenidos por las mismas personas al responder a esas dos formas. Se debe asegurar un mximo de equivalencias y deben ser pruebas que tengan varianza verdadera idntica y ninguna superposicin de varianza de error. 3. El VADS (prueba de memoria auditiva y visual de dgitos) se propone para evaluar la habilidad para reproducir estmulos que se presentan fundamentalmente en forma sucesiva. Tiene una base conceptual cognitiva y se emplea para predecir el desempeo escolar a travs de la repeticin de dgitos (en nios de 5 y medio a 12 aos). El material es presentado por el examinador en forma oral y grfica, y el nio debe reproducirlo tambin en forma verbal y escrita combinando todas las posibilidades. Existe una alta correlacin entre los resultados obtenidos en los diferentes subtests y los valores alcanzados en la integracin intra - sensorial (integracin de los estmulos y respuestas que corresponden a un mismo modo sensorial) e inter sensorial (integracin de los estmulos y respuestas que corresponden a diferentes modos sensoriales) por un lado; y el rendimiento en el aula por el otro. De esta manera tambin constituye una prueba sencilla, valida y confiable para evaluar la capacidad de formular secuencias. El VADS est compuesto por 26 tarjetas impresas con dgitos, divididas en 4 subtests que miden: Memoria inmediata visual. Memoria inmediata auditiva. Integracin intra-sensorial (capacidad de poder integrar la informacin por la misma entrada y salida). Integracin inter-sensorial (tienen dos modalidades diferentes y es ms difcil). Se toma la memoria inmediata porque se supone que si est funcionando mal, tambin ser defectuosa la memoria de largo plazo.
42
2) El autoconcepto. Formas verbal y pictrica. El autoconcepto consiste en medir cmo se siente el sujeto ante una serie de actividades estables, esto reflejan la autoevaluacin de sus atributos personales. Se le presentan una serie de frases que describen como se siente la mayora de las veces, y el sujeto debe responder por si o por no. Su basamento terico es a partir de las elaboraciones de Piess Harris y est compuesto por seis subescalas: Comportamiento; imagen corporal; popularidad; status intelectual y escolar; ansiedad; y bienestar y satisfaccin. El ndice del autoconcepto se refleja en dos tipos de puntajes: Un puntaje bruto total; y un puntaje percentilar. Para determinar la validez del puntaje (No sera confiabilidad?), se analizan dos ndices: 1. Respuestas sesgadas: Mide el grado en que las respuestas dadas por un nio o joven pueden estar afectadas por cierta tendencia (decir siempre si o responder siempre no). 2. Respuestas inconscientes: Mide el grado en el cual las respuestas dadas tienen consistencia interna a lo largo de la prueba individual. Para una interpretacin completa de los datos obtenidos primero hay que considerar la posible validez, tanto por respuestas sesgadas como para respuestas inconscientes. Los indicadores de validez (de mentira) son: a) Distorsiones deliberadas: Puntajes a ms de 1,5 desviaciones estndar deben ser tomados con cautela. Puede indicar una tendencia a hipervalorarse o falta de autocrtica. Los puntajes muy bajos indican una real desvalorizacin o un autoconcepto negativo. b) Tendencia a la aquiescencia: Tendencia de un sujeto a responder siempre de la misma forma. Los protocolos con ms de 52 o menos de 24 Si deben ser tenidos muy en cuenta. c) Respuestas al azar: Si analizamos las respuestas podemos encontrar algunos patrones que sugieren inconsistencia lgica. Responder Si en el tem 5 (soy inteligente) y No en el tem 53 (soy un tonto). 3) Evaluacin de la inteligencia: La escala de Weschler WICS - III. El test de inteligencia para nios, Wisc III de Weschler, es un instrumento clnico de administracin individual para evaluar la capacidad intelectual de nios de 6 a 13 aos y 11 meses. Consta de varios subtests que han sido seleccionados con miras a la investigacin de diferentes habilidades mentales, que en su conjunto reflejan la capacidad intelectual general de un nio. El desempeo del nio se resume en tres puntajes compuestos: Los CI verbales, de ejecucin y la escala completa. Adems de ello, nos brinda cuatro puntajes ndices basados en factores opcionales.
43
Weschler concibi la inteligencia como la capacidad del individuo de actuar deliberadamente, pensar racionalmente y relacionarse eficazmente con su medio. La concibe no como una capacidad particular sino como una entidad compleja y global. Los subtests de inteligencia WISC III se seleccionaron con miras a la investigacin de diferentes habilidades mentales que en su conjunto reflejan la capacidad intelectual general de un nio. Para l hay: 1. Inteligencia social: Interaccin con otros sujetos. 2. Inteligencia verbal: Capacidad para vincular signos y smbolos; cualquier simbolizacin o codificacin. 3. Inteligencia de ejecucin o prctica: Manipulacin de objetos concretos. Los trece subtests que contiene estn organizados en dos grupos: Verbales y de ejecucin, que se administran alternadamente y en la siguiente sucesin: 1. Completamiento de figuras: Consiste en mostrar al nio una serie de ilustraciones a las cuales le falta una parte que debe identificar. Evala la atencin visual, el reconocimiento o identificacin visual, y permite diferenciar los detalles esenciales de los superficiales. 2. Informacin: Preguntas presentadas oralmente, que tienen que ver con conocimientos sobre hechos, lugares y personas. 3. Claves: Consiste en que el nio coloque debajo de cada figura o nmero un smbolo preestablecido para cada uno. Evala coordinacin viso motora, la memoria visual a corto plazo, la habilidad para seguir instrucciones, etc. 4. Analogas: Conjunto de pares de palabras presentadas oralmente. El nio explica las analogas con los objetos comunes o con los conceptos que esas palabras representan. 5. Ordenamiento de historias: Se presenta al nio una serie de figuras que debe ordenar para formar una historia con secuencia lgica. Evala la capacidad para establecer una secuencia y manejar conceptos temporales, anticipar consecuencias, relacionar la parte con el todo, la organizacin perceptual, etc. 6. Aritmtica: Problemas matemticos que el nio resuelve mentalmente. La solucin debe expresarse oralmente. 7. Construccin con cubos: El nio debe reproducir figuras que se le muestran, con cubos de colores. Evala la capacidad para separar el todo de sus partes componentes y recomponerlo (anlisis y sntesis), la organizacin perceptual, la capacidad para reproducir modelos, coordinacin viso motora, etc.
44
8. Vocabulario: Palabras presentadas oralmente que el nio define oralmente, les atribuye un sentido. Para evaluar la confiabilidad de este subtest, podemos dividir el total de los tems de la tcnica en dos mitades. Cada parte debe ser representativa de la totalidad en todos sus aspectos significativos y las dos mitades deben realizarse en la misma sesin. Para esto se debera medir el grado de dificultad de cada palabra y separarlas en dos mitades equivalentes (teniendo en cuenta su dificultad). 9. Composicin de objetos: El nio debe armar rompecabezas de objetos comunes. Evala la habilidad para percibir y construir de la parte al todo utilizando claves mnimas; la organizacin perceptual y espacial; la coordinacin viso motora, etc. 10. Comprensin: Preguntas presentadas oralmente donde el nio debe resolver problemas de la vida cotidiana, demostrando comprensin de conceptos y normas sociales. 11. Bsqueda de smbolos: 12. Retencin de Dgitos: Secuencia de dgitos presentados oralmente. El nio debe repetir textualmente los dgitos en orden directo e inverso. 13. Laberintos: El nio debe responder una serie de laberintos marcando el recorrido con un lpiz. Evala la organizacin perceptual; habilidad espacial; capacidad para seguir un modelo visual; capacidad de anticipacin; coordinacin viso motora, etc. Este subtest no cuenta para el clculo de CI. El Wisc III tiene pruebas que evalan tanto la inteligencia teorizada por Spearman, como la pensada por Cattel y Horn. Spearman plantea la existencia de tres factores para la inteligencia: Factor G: Factor comn que gobierna todas las habilidades del sujeto, es una especie de energa mental que permite que el sistema intelectual funcione; la cantidad de G es constante intrasujeto y variable intersujeto. Dentro de este factor, se pueden medir dos capacidades; la capacidad eductiva (capacidad de extraer relaciones de un todo desorganizado; supone dar sentido a la confusin, desarrollar nuevas comprensiones, percibir lo que no es inmediato), y la capacidad reproductiva (capacidad del sujeto para acumular conocimientos, apelar a ellos ms tarde y reproducirlos; envuelve el dominio, el recuerdo y la reproduccin del material mayormente verbal que constituye un acervo cultural de conocimientos explcitos verbales). Factor E: Se refiere a habilidades especficas, es variable inter e intra sujeto.
45
Factor de las unidades funcionales: Como mediadores entre G y E, son factores no intelectuales que inciden en el rendimiento intelectual.
Por su parte, Cattel y Horn desarrollan una teora que sostiene que el factor G de Spearman, se puede dividir en dos dimensiones principales: Inteligencia fluida: Se refiere a la eficiencia mental esencialmente no verbal y con relativa independencia de la cultura; involucra la capacidad de resolver problemas que requieren adaptacin y flexibilidad al enfrentarse con estmulos novedosos con los que el sujeto no est familiarizado. Un ejemplo, es la prueba de Construccin con cubos. Inteligencia cristalizada: Relacionada con habilidades y conocimientos adquiridos cuyo desarrollo dependen en gran medida de la exposicin a la cultura; son las funciones cognoscitivas sobreaprendidas y bien establecidas, se refiere al funcionamiento intelectual que depende del entrenamiento previo, el tipo de educacin recibido y el nivel cultural en general. El subtest Informacin es un ejemplo para medir este tipo de inteligencia. Si bien el Wisc evala ambas, por lo general los subtests de ejecucin ponen a prueba la inteligencia fluida y los subtests verbales, la cristalizada. Por ltimo, el trmino organizacin perceptual describe la capacidad hipottica que subyace al factor para los tems de contenido (perceptual), como de proceso mental (organizacin). Este factor parece medir una variable comn a varias subpruebas de escalas de ejecucin. 4) El concepto de inteligencia exitosa de R. Sternberg. Para R. Sternberg, la inteligencia exitosa se divide de tres maneras: A. Inteligencia analtica: Consiste en resolver problemas y juzgar la calidad de las ideas. B. Inteligencia creadora: Capacidad para formular problemas y buenas ideas. C. Inteligencia prctica: Capacidad para usar las ideas y la comunicacin no verbal. 5) Los distintos tipos de inteligencia segn H. Gardner. La inteligencia para Gardner tiene que ver con la capacidad para resolver problemas. Hay al menos siete tipos:
46
1. Lingstica: Capacidad para usar las palabras de manera efectiva en forma oral u escrita; incluye sintaxis, fontica, semntica, pragmtica, retrica, mnemnica, retrica y capacidad para usar los nmeros de manera efectiva y razonar adecuadamente. 2. Espacial: Habilidad para percibir de manera exacta el mundo visual espacial y de ejecutar transformaciones sobre esas percepciones. 3. Corporal- kintica: Capacidad para expresar ideas y sentimientos usando todo el cuerpo y la facilidad en el uso de las manos para producir o transformar cosas (Ej. artesano). 4. Lgico- Matemtica; Capacidad para identificar modelos, calcular, formular y verificar hiptesis, utilizar el mtodo cientfico y los razonamientos inductivo y deductivo 5. Musical: Capacidad de percibir, discriminar, transformar y expresar formas musicales. 6. Interpersonal: Capacidad para reconocer las seales que emiten los otros y responder a ellas de manera efectiva. 7. Intrapersonal: Conocimiento de si mismo y la capacidad para adaptar las propias maneras de actuar de acuerdo ese conocimiento. Cada persona posee las 7 inteligencias y la mayora puede desarrollarlas hasta un nivel adecuado de competencia. Las inteligencias por lo general trabajan juntas de manera compleja, pero hay muchas maneras de ser inteligente dentro de cada categora. Que las inteligencias se desarrollen o no, dependen de 3 factores: Dotacin biolgica, historia de vida personal, y antecedentes culturales e histricos. Por otra parte, existen ciertos requisitos para ser considerada una inteligencia: Aislamiento potencial por daos cerebrales; existencia de idiotas sabios; historia de desarrollo ms un estado final; historia y plausibilidad evolutiva; apoyo de descubrimientos de la psicometra; apoyo proveniente de trabajos de Psicologa experimental; operacin central o un conjunto de operaciones identificables; susceptibilidad de codificacin en un sistema simblico. 6) El diagnstico psicopatolgico: La entrevista EDIJ. La Entrevista Diagnstica Infanto Juvenil (EDIJ) est basada en la nosologa para trastornos mentales que propone el DSM- III. Cada uno de los denominados trastornos se conceptualiza como un sndrome o patrn psicolgico. La EDIJ est integrada por tres partes centrales: 1) Una entrevista conjunta inicial con el nio y los padres (est pensada para usarse con personas de 5 a 18 aos). Contiene 19 tems, se puede aplicar en el encuentro inicial (lo que no quita que el profesional prefiera entrevistar por separado a padres y nios primero). Si se trata de adolescentes puede suceder que ellos quieran brindar la informacin que se solicita sin que medie la presencia de los adultos. Dicha informacin se verifica en la anamnesis. 2) .Una entrevista con el nio o joven (tems 20 a 226). Si se trata de chicos menores a 8 aos, esta seccin es contestada por los padres o adultos a cargo.
47
3) Entrevista con los padres. Incluye datos sobre el desarrollo del chico, su anamnesis, as como algunos pocos diagnsticos no abarcados en la seccin anterior referente a trastornos profundos del desarrollo (tems del 267 al 311). Hay una hoja de respuestas donde se consignan las respuestas codificadas (1 = no o sntoma ausente, 9 = no sabe no contesta, y 2 = sntoma presente). Se administra cuando se necesita ubicar sntomas de la persona entrevistada en alguna de las categoras diagnsticas, como por ejemplo dficit de atencin, trastornos de conducta o afectivos, etc. Es un relevamiento rpido de la anamnesis, y puede incluirse en un psicodiagnstico. Sirve tambin como parte de una entrevista a padres y como gua para estructurar una entrevista semi-estructurada. Por otra parte, toma tres reas principales: Datos bsicos, cronolgicos, y preguntas acerca de la implicancia social de la problemtica. Unidad III: Evaluacin psicolgica de adolescentes y adultos Los estilos de personalidad: El inventario MIPS. El MIPS es un Inventario de Estilos de Personalidad. Se utiliza para evaluar rasgos de la personalidad normal. Su administracin puede ser tanto individual como colectiva, y se presenta en un cuadernillo con respuestas bipolares de Verdadero o Falso. Estudia la personalidad normal de sujetos entre 18/65 aos. No evala patologa (a diferencia del MMPI) sino que es utilizado para detectar la presencia y el grado de un estilo de personalidad particular. Se aplica sobre todo en el mbito laboral donde es utilizado para evaluar y seleccionar personal con determinados rasgos, tambin se usa en la comparacin de grupos. Otro mbito de aplicacin es el de orientacin vocacional. Su aplicacin se traduce en un inventario de 180 tems compuesto por 24 escalas agrupadas en 12 pares, es decir, tems cuyas respuestas se contestan por verdadero o falso. Esta prueba esta distribuida en tres reas con los siguientes contenidos: Metas motivacionales: Se refiere a los motivos que orientan a las personas y son impulsoras del estilo de personalidad. Las metas son las que orientan las conductas. Se relaciona con la obra de Freud y presenta gran afinidad con conceptos como pulsin, necesidad, afecto y emocin. Las bipolaridades son Apertura Preservacin (en qu medida la conducta del sujeto est motivada a obtener un refuerzo positivo o a evitar una estimulacin negativa del mundo); Modificacin Acomodacin (en qu medida el sujeto tiende a modificar el medio o a acomodarse a l); e Individualismo Proteccin (segn la fuente del refuerzo est ms relacionada con metas del sujeto o relacionadas con los dems). Modos cognitivos: Examinan los estilos que emplean los sujetos para construir sus cogniciones y transformarlas. Relacionado con la obra de Jung, abarca tanto las fuentes utilizadas para adquirir conocimientos sobre la vida, como el modo de transformar la informacin. Las bipolaridades son Extraversin Introversin; Sensacin Intuicin; Reflexin Afectividad; y Sistematizacin Innovacin.
48
Conductas interpersonales: Evala los modos y preferencias de los sujetos en su interaccin con otros sujetos. Un estilo de conducta social deriva en parte de la interaccin entre las pautas caractersticas de las metas motivacionales y los modos cognitivos de una persona. Las bipolaridades son Retraimiento Comunicatividad; Vacilacin Firmeza; Discrepancia Conformismo; Sometimiento Control; e Insatisfaccin Concordancia. Dado que los cuestionarios autoadministrables son vulnerables al estilo y actitud del sujeto, y por lo tanto, susceptibles de distorsiones en las respuestas, los autores idearon cuatro escalas que denominaron de validez. Estas intentan determinar el grado de confianza con el que pueden hacerse inferencias teniendo en cuenta la actitud del sujeto al responder (para detectar las distorsiones). Por medio de las mismas se mide por ejemplo: aquiescencia, contradiccin, el querer dar una imagen que no sea la propia (ya sea mejor o peor), etc. Esto fue una innovacin y a partir de ese momento la mayora de las tcnicas incluyen este tipo de escalas: Autoconcepto, MMPI-A, MMPI-2, MIPS, etc. Adems cuenta con tres indicadores de validez que dan cuenta de la tendencia a la distorsin: Escala de impresin positiva: Incluye tems que permiten detectar si el sujeto intenta dar una imagen positiva de si mismo. Escala de impresin negativa: Incluye tems que permiten detectar si el sujeto intenta dar una imagen positiva de si mismo. Escala de consistencia: Incluye tems que permiten determinar si el sujeto es consistente en sus respuestas. Un puntaje inferior a tres indica una consistencia de la prueba muy baja.
La prueba MIPS utiliza como puntuaciones transformadas el puntaje de prevalencia inventado por Millon en base al concepto dimensional clasificatorio en la medicin de la personalidad. Agrupa a los individuos en las distintas categoras segn rasgos y posicin en relacin a otros, basado en datos de prevalencia de la poblacin. Los puntajes de prevalencia van de 0 a 100 y el sistema ha sido diseado de tal modo que la proporcin de individuos que obtienen un puntaje de 50 o superior poseen ese rasgo en el conjunto de la poblacin. Por el contrario, si no llega a 50, se considera que no lo posee. Los perfiles individuales del puntaje se interpretan en funcin de la distancia que los separa del puntaje de prevalencia 50 de cada escala. Un puntaje de 69 de cualquier escala se encuentra en la mediana o percentil 50 de los individuos clasificados como poseedores del rasgo. Tambin proporciona normas para adultos y estudiantes universitarios tanto con o sin discriminacin de edad y sexo. Existe una vinculacin entre el concepto de inteligencia exitosa de Sternberg, y el rea de modos cognitivos del MIPS, en el que se examinan los distintos estilos de procesamiento y
49
recoleccin de informacin. Tomemos por ejemplo la bipolaridad sistematizacin innovacin. Esta ltima implica que quienes la presenten sern creativos y asumirn riesgos, transformarn lo dado, sern disconformes con la rutina y lo predecible, producirn consecuencias nuevas e imprevistas. Si observamos entonces una presencia del rasgo innovacin, podramos pensar a su vez en una presencia de inteligencia creativa en este sujeto. En cambio si consideramos la bipolaridad reflexin afectividad y dentro de ella la escala reflexin, estaramos ms del lado de la inteligencia analtica, ya que la misma hace referencia a que prefieren procesar los conocimientos por medio de la lgica y el razonamiento analtico; se basan en juicios desapasionados, impersonales y objetivos. Un estudio de confiabilidad que se podra hacer con el MIPS sera utilizando el mtodo test - retest, es decir, repetir la toma en una segunda oportunidad en un lapso no mayor a seis meses. Otro mtodo que podramos utilizar es el de formas equivalentes en el cual se preparan dos formas de la tcnica de evaluacin (del MIPS), es decir, se podra cambiar el orden de las preguntas teniendo en cuenta que en ambas deben tener los mismos tems. Luego de las dos tomas deben correlacionarse los puntajes obtenidos. 2) Personalidad y Psicopatologa: El inventario MMPI 2. Comparacin con el MMPI - A. El MMPI (Inventario Multifactico de la Personalidad de Minnesota) fue diseado como un medio objetivo para obtener informacin clnica. Evala la personalidad patolgica y es aplicado mayoritariamente en el mbito clnico y para la investigacin en general. El conjunto de escalas fue elegido para evaluar sndromes relevantes clnicamente y tambin para ayudar al clnico a arribar a un diagnstico, pero no permite diagnosticar por si mismo, arroja sntomas. Luego de un tiempo se evidenci la necesidad de actualizarlo y mejorarlo; reestandarizar y modernizarlo ya que haba tems que resultaban anacrnicos, otros mal formulados o aludan a temas que ya no eran pertinentes. De esta manera, el MMPI 2 fue creado a principios de la dcada del 80, cuando se constituy un comit para la revisin del MMPI. A partir de all, el inventario diagnostica patologas estudiando la personalidad multifsicamente. Comprende a adultos entre 18 y 65 aos y se aplica en el mbito clnico, forense y laboral. Cuenta con escalas de validez que han sido elaboradas para determinar el grado de confianza con que pueden hacerse inferencias, teniendo en cuenta la actitud que el sujeto adopta al contestar la prueba. Las escalas de validez son: Escala interrogantes : Corresponde al nmero total de tems no respondidos o respondidos al azar en ambas direcciones V-F (30 o ms tems invalida el protocolo). Escala L: Detecta el intento deliberado del sujeto en dar una buena imagen de si. Escala F: Un puntaje elevado indica que se ha respondido en forma atpica, marcando una exagerada cantidad de sntomas. En caso de que el sujeto no presente serias perturbaciones podra pensarse en un intento por mostrarse como una persona inadecuada, incompetente o mentalmente enferma.
50
Escala K: Se desarroll como un modo ms sutil y efectivo de detectar intentos de los sujetos de presentarse bajo una luz ms favorable, negando sntomas psicopatolgicos. En el MMPI2 esta escala se usa como factor corrector de algunas escalas clnicas.
Por otra parte, las escalas clnicas son las que evalan diferentes dimensiones de la personalidad y obtienen informacin acerca de una probable patologa. Las escalas son: hipocondriasis, depresin, histeria, desviacin psicoptica, masculinidad-feminidad, paranoia, psicastenia, esquizofrenia, hipomana, e introversin social. Las escalas clnicas que integran la trada neurtica en el MMPI - 2 son: Escala 1- Hs - Hipocondriasis: Personas que se caracterizan por presentar preocupacin por su salud corporal y temores concomitantes por enfermedades. Algunos de los tems reflejan sntomas especficos, otros se refieren a una preocupacin corporal ms general y otros reflejan las caractersticas egocntricas que pueden presentar estos sujetos. Es la escala ms homognea y unidimensional. Los puntajes elevados tienen un T mayor a 60. Escala 2 D - Depresin: Evala depresin sintomtica. Los sntomas presentan un estado de desmoralizacin, desesperanza respecto al futuro e insatisfaccin general en relacin con la situacin vital. Los puntajes elevados sugieren depresin clnica y los puntajes moderados una actitud general o un estilo de vida caracterizado por el pesimismo. Escala 3 - Hy - Histeria: Identificar pacientes con alguna forma de trastorno sensitivo o motor sin que pudiera encontrarse etiologa orgnica. Otro grupo de tems se refiere a la negacin de dificultades psicolgicas y emocionales, y a sentimientos de incomodidad en situaciones sociales. Las personas que presentan defensas histricas suelen obtener puntuaciones elevadas en ambos conjuntos. Tienden a obtener puntajes altos sujetos con nivel cultural elevado y mujeres. Un puntaje alto es un T mayor a 80. Por otra parte, el MMPI2 tambin contiene escalas de contenido y escalas suplementarias. Aparte, conserva la estructura formal del MMPI (10 escalas clnicas y 4 de validez). Lo que se ampli es el conjunto de tems. A su vez mantuvo el puntaje T para la transformacin de los puntajes brutos y no se modific el Factor Corrector K. El MMPI tambin evaluaba poblacin adolescente; cuando se revis y se cre el MMPI-2 se formul una versin de este ltimo para adolescentes especficamente, el MMPI - A. En cuanto a las aplicaciones que tiene el MMPI - 2, se lleva a cabo con sujetos entre 18 y 65 aos que sepan leer con fluidez y comprendan las instrucciones acerca del modo correcto de registrar las respuestas. A los sujetos con condiciones fsicas o emocionales que pueden limitar su capacidad para responder (como por ejemplo un sujeto con limitaciones visuales, dislexia o afasia, dificultades en el aprendizaje, intoxicacin por drogas / alcohol, etc.) no se lo pueden autoadministrar sino que hay que lerselos. El nmero de tems es de 567 y se pueden dejar, como mximo, 30 sin contestar (para que la
51
prueba se pueda evaluar). Para el anlisis se transforman los puntajes brutos en puntajes T y luego se vuelcan al perfil. El MMPI - 2 puede administrarse en el rea clnica, laboral y forense. Dentro del rea clnica en evaluaciones neuropsicolgicas, psicopatologa y psicodiagnstico de pacientes psiquitricos. En el rea laboral, para la seleccin de personal, para descartar cualquier patologa. En el rea forense para investigar casos de simulacin y defensividad, o para determinar el grado de imputabilidad de un acusado. El MMPI - A, brinda informacin acerca de las autopercepciones de los adolescentes. Incluye reas como influencia negativa del grupo de pares, abuso de drogas y alcohol, problemas de relacin con los padres, problemas alimentarios, dificultades escolares entre otras. Su aplicacin es de utilidad en la prctica profesional, pues brinda informacin sobre la autopercepcin de los adolescentes. Su inclusin en tareas diagnosticas es altamente recomendable y tambin es buena su administracin en el rea educacional. Sirve para sujetos entre 14 y 18 aos que lean fluidamente y tengan capacidad de comprensin del material (a los sujetos con limitaciones se le leen los tems). Se deben procurar condiciones ambientales adecuadas, privacidad y comodidad, ya que la evaluacin dura aproximadamente 1 hora 30 minutos y consiste en tener que contestar 478 frases por V/F en forma individual o grupal. En base a los puntajes brutos se elaboran perfiles segn el sexo. La diferencia fundamental radica en la forma que se utiliz el formato original. Aqu se realiz con una adaptacin al lenguaje y a las problemticas propias de la etapa adolescente, es decir, la versin para adolescentes incluye tems nuevos relacionados con temas del desarrollo psicolgico y sus trastornos, propios de esta etapa evolutiva. Se reduce el nmero total de preguntas a responder en 478 y adiciona nuevas escalas de contenido especficas para esta etapa del ciclo vital: Problemas escolares, bajos niveles de adaptacin, problemas de conducta. Por ltimo, incorpora tres escalas suplementarias nuevas desarrolladas para la evaluacin del uso de alcohol y drogas e inmadurez. El MMPI A est compuesto por: Escalas de validez, escalas clnicas, escalas de contenido y escalas suplementarias. Las escalas de validez apuntan a determinar el grado de confianza con que pueden hacerse inferencias, teniendo en cuenta la actitud del sujeto al contestar las preguntas. Estas son: A. Interrogantes: Nmero de tems no respondidos o respondidos V/F. B. Mentira (L): Intentos de dar una buena imagen. C. Infrecuencia (F): Sujetos que dan una mala imagen de s. F1: Aceptabilidad para escalas bsicas. F2: Aceptabilidad para escalas de contenido y suplementarias.
52
D. Defensividad (K): Sujetos que responden defensivamente. E. Vrin: tems con contenido similar u opuesto. F. Trin: tems con contenido opuesto que son respondidas inconsistentemente. Las escalas utilizadas transformadas son la T y en cuanto a las escalas clnicas, evalan distintas dimensiones de la personalidad y obtienen informacin sobre probables patologas. Una puntuacin T mayor a 65 es significativa, y menos de 60 es un puntaje no significativo. Las escalas clnicas son las mismas que en el MMPI - 2. Las escalas de contenido estn centradas en dimensiones no patolgicas y son las siguientes: Ansiedad, obsesiones, depresin, preocupaciones por la salud, alienacin, pensamiento bizarro, enojo, cinismo, problemas de conducta, baja autoestima, bajas aspiraciones, disconformidad social, problemas familiares, problemas escolares, actitudes negativas hacia el tratamiento. Por ltimo, las escalas suplementarias brindan informacin que en el original no fueron tenidas en cuenta: Alcoholismo, reconocimiento, propensin, ansiedad, represin. 3) La evaluacin de la inteligencia. La prueba de matrices progresivas de Raven. El marco terico del Test de Matrices progresivas es la teora eclctica de los dos factores de Spearman: Factor G y Factor E. El Test de MP evala solamente el factor G. Spearman considera que todas las habilidades del hombre tienen un factor comn general (FG) y un factor especifico a cada una de ellas (FE). En cada habilidad se encuentran los dos factores pero no desempean el mismo papel en todas las habilidades. Investigaciones ulteriores demostraron la existencia de un factor de grupo que se encuentra en gran parte de habilidades afines. El test de MP evala la capacidad de los sujetos para comparar formas y razonar por analogas con independencia del conocimiento adquirido anteriormente. Tambin diferencia la capacidad eductiva (razonamiento abstracto -factor g- que permite resolver los problemas de una manera creativa) de la capacidad reproductiva. Este test consta de tres escalas: Escala coloreada (MPC): Para nios de hasta 11 aos, ancianos y personas con retraso mental. Escala general (MPG): Para sujetos de 18 aos en adelante. Escala avanzada (MPA): Para sujetos sospechados de estar dotados intelectualmente.
53
De esa manera se evala la capacidad para establecer la relacin existente entre dos elementos y la deduccin de correlatos. Por ltimo, se llama progresiva porque aumenta su dificultad a medida que se avanza por las series. Este test se puede aplicar en diversas reas: rea educativa: Con bajo costo y de manera rpida, da la mayor parte de la informacin significativa que da un test de inteligencia global. Ej.: Formacin de clases homogneas pudiendo agrupar, de esta forma, a los alumnos con capacidades intelectuales similares. rea clnica: Se pude medir por ejemplo, el deterioro mental para un primer examen de capacidad intelectual. rea laboral: Por ejemplo se puede utilizar para la evaluacin y clasificacin de aspirantes a un puesto; diagnstico rpido de la capacidad intelectual y las fallas de razonamiento del sujeto.
El test de Raven es utilizable como instrumento de investigacin bsica y aplicada. En sta ltima sirve como instrumento de clasificacin educacional, militar e industrial, y como test clnico. Se lo emplea en los centros de investigacin psicolgica y sociolgica: para estudios diferenciales y sociales de capacidad intelectual, segn edad, sexo, medio, status econmico, profesin. En los establecimientos de enseanza primaria y secundaria, para ayudar en la formacin de clases homogneas mediante la agrupacin de los alumnos de capacidad intelectual semejante. Para discriminar el tipo predominante perceptivo o lgico de los alumnos, particularmente en aquellos casos que se destacan por una alta o baja capacidad o rendimiento. En los gabinetes de orientacin vocacional y seleccin de personal, para la evaluacin de los estudiantes y la clasificacin de los aspirantes a ingresar a oficinas y establecimientos industriales o comerciales. Es til para un diagnstico rpido del nivel intelectual y la eventual determinacin del mtodo y fallas del razonamiento de un sujeto. Tambin en el ejrcito, para una gil y econmica medicin y seleccin de cuadros. Con este objetivo fue empleado en gran escala en la Segunda Guerra Mundial por la armada britnica. Por ltimo, en las clnicas psicolgicas, para un primer examen de la capacidad intelectual y como medio de examen del deterioro mental. En comparacin con el Wisc III, el test de matrices progresivas es un test de seleccin entre soluciones posibles. Para su administracin consta de un cuadernillo con 60 lminas, estas presentan figuras geomtricas abstractas. Las lminas estn ordenadas en 5 series de 12 tems que aumentan la dificultad a medida que se avanza por ellas. Este test es de completamiento de matrices segn opciones predeterminadas y evala la capacidad intelectual para comparar formas y razonar por analogas con independencia de los conocimientos adquiridos (mide capacidad intelectual general). El Wisc III evala la capacidad intelectual de nios de 6 a17 aos de edad, en cambio el MP se administra a adultos y adolescentes. Es un test no verbal y como tal, puede ser administrado en determinadas circunstancias en las cuales el sujeto no pueda dar una respuesta verbal
54
(debido por ejemplo a una discapacidad). Esto no puede hacerse con el Wisc III. Por otra parte, el TMP es autoadministrable, mientras que el Wisc no lo es. Puede administrarse tanto individual como colectivamente, en cambio el Wisc solo puede administrarse individualmente. En cuanto a los resultados, en el TMP se obtienen a partir de un puntaje bruto por cada serie (5 series) y luego un puntaje bruto total sumando los puntajes de cada serie. Posteriormente el PB se pasa a percentil y luego a rango; en cambio el Wisc est formado por trece subtests organizados en dos grupos: escala verbal (evala inteligencia cristalizada) y escala de ejecucin (evala inteligencia fluida). Se administran alternativamente. Por ltimo, tanto el TMP como el WISC se basan en la teora de Spearman (explicada en la Unidad II, punto 3). Raven toma la teora directa midiendo una parte de la inteligencia: La capacidad eductiva; mientras que Weschler realiza una modificacin y mide toda la inteligencia. 4) La verbalizacin de afectos: Escala de alexitimia TAS 20. Se entiende por alexitimia a la falta de palabras para expresar emociones y sentimientos. Es un constructo hipottico que describe una constelacin de manifestaciones cognitivas y afectivas originalmente observadas en pacientes con trastornos psicosomticos. Sus caractersticas centrales son la dificultad para describir e identificar emociones propias, la dificultad para distinguir entre sentimientos y sensaciones fsicas, baja capacidad para simbolizar, y la presencia de pensamientos operatorios que tienden a focalizarse ms en los aspectos externos de un suceso que en las experiencias subjetivas del mismo. La alexitimia es un indicador clnico y no un cuadro monogrfico, es decir, acompaa a cuadros patolgicos y tambin puede coexistir con cuadros de la personalidad. Recientes estudios permitieron adicionar otras caractersticas a la conducta de los sujetos caracterizados como alexitmicos: A. Conformismo social, sumisin a estereotipos culturales. B. Baja capacidad introspectiva. C. Presencia de sntomas fsicos asociados, predominio del lenguaje corporal para expresar emociones. D. Resistencia a las psicoterapias derivadas de la prctica psicoanaltica (son necesarias terapias que utilicen recursos ms concretos). E. Poca capacidad para emocionarse ante circunstancias conmovedoras. Con el objetivo de validar el concepto de alexitimia y elaborar un instrumento fiable y vlido, Taylor y sus colaboradores desarrollaron la Escala de Alexitimia de Toronto, TAS 26, compuesta por 26 tems cada uno, de los cuales se contestaba a travs de una escala tipo
55
Likert de 5 puntos. Originalmente Taylor estableci y defini 5 reas de contenido que reflejaran el dominio del constructo (marco terico definido por Taylor para TAS 26): 1. Dificultad en describir sentimientos. 2. Dificultad en distinguir entre sentimientos y las sensaciones corporales que acompaan a los estados de activacin emocional. 3. Ausencia de introspeccin. 4. Conformismo social. 5. Vida fantasiosa empobrecida y fracaso en el recuerdo de sueos. El TAS - 20 es la segunda versin revisada de el TAS original y est integrada por 20 tems (conserva 13 tems de TAS 26) cada uno de los cuales se punta tambin a travs de una escala tipo Likert de 5 puntos (cinco posibilidades de respuestas) que muestra el grado de conformidad / disconformidad con el enunciado. La puntuacin obtenida por un sujeto puede oscilar entre los 20 y los 100 puntos. Se considera alexitmico a un sujeto que obtenga una puntuacin igual o superior a 61. Una puntuacin igual o mayor a 90 habla de una alexitimia marcada. Las diferentes investigaciones realizadas con las TAS-20 muestran un mapa factorial compuesto por tres factores: 1. Factor I: Dificultad para identificar sentimientos y diferenciarlos de las sensaciones corporales o fisiolgicas que acompaan a la activacin emocional. 2. Factor II: Dificultad para describir sentimientos a los dems. 3. Factor III: Pensamiento orientado hacia lo concreto, lo fctico, y sin relacin con lo emocional. De esta manera se mantienen tres de los cinco criterios definidos por Taylor originalmente. Los dos primeros factores presentan altas correlaciones entre s, sin embargo un modelo de tres factores proporciona un mejor ajuste a los datos. Las emociones existen en todas las culturas y tienen una dimensin tica, pero no todas valorizan de la misma manera las manifestaciones intrapsquicas para entenderlas, sino que tambin consideran las manifestaciones corporales o su dimensin religiosa o moral. Esto tiene que ver con lo dimensin mica. Siempre aparecen como alexitmicos las minoras tnicas, los sectores sociales bajos, los inmigrantes y refugiados. Podra deberse a prohibiciones culturales respecto de contar o reconocer problemas personales fuera del grupo inmediato de pertenencia. Las personas subordinan necesidades privadas al mantenimiento del bienestar colectivo. Las manifestaciones clnicas de una patologa pueden ser culturalmente invariantes, la experiencia de sentirla y reconocerla como tal tiene una marcada variacin cultural.
56
La alexitimia es un trastorno en el procesamiento emocional caracterizado por la dificultad para identificar y expresar emociones, as como por una tendencia a focalizar y ampliar las sensaciones somticas que acompaan a la activacin emocional. Entonces tomando el rea afectiva de la definicin, es decir, la incapacidad de los sujetos para expresar sus sentimientos, y observando las caractersticas de la cultura Argentina y de la cultura Japonesa podemos ver algunas cuestiones. Con respecto a la forma de comunicar los sentimientos estas culturas son totalmente diferentes. En Japn hablar de los problemas ntimos o emocionales no es lo acostumbrado, rara vez ocurre, en cambio en Argentina es moneda corriente hablar de temas sentimentales. Sin embargo estas diferencias no inciden en los resultados obtenidos en las distintas adaptaciones de la TAS 20 en los diferentes pases. La TAS 20 ha sido adaptada a diversas lenguas y mbitos culturales como la India, Japn, Finlandia y Canad. En todos ellos se obtuvo resultados de confiabilidad satisfactorios. A modo de conclusin podramos decir, a partir de lo referido anteriormente, que el constructo de alexitimia es un constructo vlido para todas las culturas, es un concepto que en sus tres factores es transcultural, se podra decir entonces que es un concepto tico, pues se podra adaptar a todas las culturas. Para poder obtener resultados confiables la tcnica debe ser adaptada a su nuevo lenguaje y mbito cultural, se deben realizar las equivalencias conceptuales, lingsticas y mtricas correspondientes, teniendo en cuenta la gran dificultad que presentan algunas lenguas en relacin al dficit en el nivel de lenguaje emocional, de significantes referidos a ese tema (nivel mico del constructo). Sin embargo hay posiciones mas radicales que consideran que alexitimia no es un concepto aplicable a todas las culturas, porque no ha sido administrado a todas ellas, se podra decir que no fue administrado en las culturas africanas. En este sentido es un concepto mico que refiere a todas aquellas culturas con algn contacto con la occidentalizacin. En el ejemplo anterior de Japn se podra decir que tanto Japn como todos los pases civilizados, poseen una cierta occidentalizacin insertada. Desde la aparicin del constructo alexitimia han sido muchas las investigaciones que han estudiado los factores que la determinaran. La razn de este creciente inters por su estudio se debe al hecho de que esta caracterstica comporta diferentes y variados sntomas en los individuos que la presentan. Una de las variables que se ha relacionado con la alexitimia es la cultura, en donde se ha reflexionado acerca de las influencias culturales en las dimensiones que la caracterizan. 5) La evaluacin de factores asociados con comportamientos alimentarios: La escala ICA. El Inventario de Conductas Alimentarias est basado en la tcnica de Desordenes de la Alimentacin (EDI), y su desarrollo se construy en la Universidad de Toronto por el profesor David Garner (1991). Es una tcnica autoadministrable de aplicacin individual o colectiva. No es una tcnica de diagnstico sino de despistaje o screening. No diagnostica formalmente la presencia de un desorden alimentario, como la anorexia, bulimia u obesidad, sino que evala rasgos o dimensiones psicolgicas que deben ser tenidas en
57
cuanta en la comprensin y tratamiento adecuado de los trastornos de la alimentacin, es decir, los sntomas relacionados con trastornos de la alimentacin. Un instrumento de Screening o despistaje es una tcnica psicomtrica utilizada para distinguir entre potenciales casos o no casos. Su finalidad es realizar un tamizado bsico respecto de la conducta o rasgo a medir por medio de algn puntaje de corte. Un ejemplo de una tcnica con la cual se puede realizar un screening es el ICA, por medio del cual se pueden determinar potenciales casos de trastornos de conductas alimentarias. Otras tcnicas pueden ser, Sucesos de vida o el BIEPS. Los instrumentos de screening tienen un papel de recoleccin de datos, esto sirve para ver si una variable esta presente o no en la poblacin. Es decir, detecta la presencia de constructos en una poblacin. Los rasgos que evala son categorizados en las siguientes once dimensiones psicolgicas: A. Deseos de adelgazar: Necesidad del sujeto de estar mucho ms delgado por su temor a ser gordo. Los tems que integran esta subescala se vinculan con preocupaciones por la dieta, el peso y el temor a aumentar de peso. B. Bulimia: Tendencia a pensar o involucrarse en comportamientos que implican comer de manera excesiva. C. Insatisfaccin corporal: sentimientos de disconformidad con determinadas partes del cuerpo propio (su forma y/o tamao), presencia de una perturbacin en la imagen corporal. D. Ineficacia: Presencia de sentimientos de inseguridad, desamparo, falta de control sobre la propia vida. Se vincula con baja autoestima o pobre autoconcepto, incluyendo adems referencias a sentimientos de vaco y soledad. E. Perfeccionismo: Presencia de pensamientos o creencias acerca de que los dems esperan del sujeto slo conductas exitosas. F. Desconfianza: Existencia de sentimientos sobre la necesidad de mantenerse alejado/a de las dems personas. G. Alexitimia: Presencia de sentimientos confusos en relacin con el reconocimiento de afectos, la imposibilidad de diferenciar sentimientos de sensaciones corporales. H. Miedo a crecer: Hace referencia al deseo de poder detener el crecimiento personal, el miedo a crecer y convertirse en adulto. I. Ascetismo: Tendencia a comportarse de manera virtuosa a travs de ciertos ideales como la autodisciplina, el autorechazo y el autocontrol.
58
J. Impulsividad: Presencia de tendencias impulsivas, hiperactividad, hostilidad, componentes destructivos en las relaciones interpersonales. Esta dimensin est relacionada con caractersticas de personalidad borderline y psicoptica. K. Inseguridad social: creencias de la persona respecto a sus relaciones sociales las que pueden ser percibidas como tensas, inseguras, desagradables, y, en general, de baja calidad. La correccin de esta prueba se realiza en forma manual utilizando la hoja de respuestas. En ella se completa para cada tem el puntaje correspondiente segn la respuesta y segn el tipo de afirmacin (fondo blanco / fondo negro). Estos puntajes se suman de acuerdo a las once dimensiones y se obtiene el puntaje bruto para cada una de ellas. Los puntajes brutos son directamente convertidos en valores percentilares. Para completar la casilla del percentil correspondiente a cada escala, se utilizar la tabla Conversin de puntajes brutos a percentiles. Para obtener el percentil se ingresa en la columna que dice PB con el valor del puntaje bruto obtenido en cada escala. Con el percentil obtenido para cada escala se traza el perfil (diagrama de barras). La lectura de los valores se realizar utilizando como gua las descripciones de las escalas (las 11 dimensiones), teniendo en cuenta que a mayor valor percentilar le corresponde mayor presencia de la dimensin descripta. Si qued algn tem sin contestar, el valor asignado mecnicamente en la correccin es cero. Hay que tener en cuenta para la evaluacin que las dimensiones a las que pertenecen dichos tems pueden encontrarse disminuidas en su valor percentilar. 6) Los sucesos del ciclo de vida. Es de suma importancia evaluar la percepcin subjetiva del impacto de los sucesos o acontecimientos del ciclo vital personal y poder relacionarlas con los malestares psicolgicos. En el campo de la psiquiatra fue Meyer quien enfatiz la importancia de los sucesos de vida en la manifestacin de patologas diversas: El cambio de hbitat, el ingreso a la escuela, un fracaso escolar, muertes y nacimientos de familiares. El acontecimiento vital es todo hecho o circunstancia en la vida de una persona capaz de alterar o modificar sus condiciones de salud psicofsica. La escala Sucesos de vida es autoadministrable, individual o colectiva, y constituye un estudio de screening. Evala el impacto subjetivo que diferentes eventos del ciclo vital tuvieron en la vida de este sujeto. l lee un listado de eventos potencialmente estresantes y marca con una cruz una puntuacin que va desde el 1 al 5. El evaluador se centra en las puntuaciones que estn entre 4 y 5. La suma de estos tems nos dar un puntaje total que se utilizar luego para hacer una entrevista ms focalizada sobre los eventos que ms sufrimiento provoc en el sujeto. sta escala est basada en la teora de Stress, que es un sndrome de adaptacin general. El estrs implica una descompensacin entre las demandas que plantea el contexto y los recursos de los que dispone una persona para hacerle frente. Debe considerarse como estresante solo una demanda que por su peculiar intensidad, novedad o indeseabilidad
59
requiere una respuesta esforzada. Las formas como el individuo hace frente a las experiencias vividas como estresantes constituyen las estrategias de afrontamiento. Dicho afrontamiento toma en cuenta los esfuerzos afectivos, cognitivos y psicosociales que un sujeto emplea para poder controlar las situaciones estresoras a efecto de reducirlas o eliminarlas. Este puede ser medido por medio de la evaluacin psicolgica, la cual supone la posibilidad de analizar los diversos comportamientos humanos a fin de comprenderlos, compararlos y explicarlos. La misma debe tener en cuenta la formulacin de conceptualizaciones ticas y operacionalizaciones micas. Todo acontecimiento vital es una experiencia social que posee una significacin psicolgica, ocurre en una etapa determinada, es percibido con cierta intensidad por el sujeto, y tiene una duracin limitada en el tiempo. Todo suceso tiene las siguientes caractersticas: A. Puede ser evaluado con muy, algo o nada deseado. B. El sujeto lo percibe como algo controlable o fuera de su control personal. C. Algn acontecimiento puede generar consecuencias indeseables aunque el hecho en si se acepte como necesario. D. Suele generar sentimientos de prdida o separacin, sean stas reales o simblicas. E. Implica necesidad de cambios en el mbito de las relaciones interpersonales y una reorganizacin de las interacciones sociales. F. Propone pensar o no, una accin posible. G. Puede suponer una amenaza para la integridad fsica del Yo. H. Que un suceso vital sea percibido como sorpresivo, depende de la informacin con que cuenta la persona. Estas son algunas de las dimensiones psicolgicas que deben tenerse en cuenta para analizar un acontecimiento vital. Por otra parte, una evaluacin adecuada tambin tiene en cuenta tres aspectos: Cundo ocurri? (etapa evolutiva); Cmo ocurri? (evala intensidad y discrimina situaciones reales de las imaginarias), Duracin (como la persona evala y describe la experiencia vivida). La escala de sucesos de vida tiene validez terica ya que esto supone que la tcnica psicomtrica tenga definido claramente el constructo terico que pretende medir. A partir de considerar que un suceso o acontecimiento vital es todo hecho o circunstancia de la vida de una persona capaz de alterar o modificar sus condiciones de salud psicofsica, afirmamos que esta escala es una buena operacionalizacin para determinar cmo es la
60
percepcin subjetiva de estos sucesos que tienen las personas. Por el anlisis factorial de la escala, esta prueba ha evidenciado tener consistencia interna. Tambin evidenci tener confiabilidad test - retest. Para esto se calcul la correlacin interna entre los puntajes de cada una de las subescalas y el puntaje total, pudindose llegar a que la tcnica tiene consistencia interna relativa, lo cual es tericamente esperable y, por lo tanto, demostrndose de este modo que la misma posee validez interna. 7) Los vnculos de apego romnticos y no romnticos. La bibliografa que corresponde a este punto, el libro de Casullo sobre la teora del apego, no haba sido editada en el 2004. Ja! 8) Evaluacin de bienestar Psicolgico. El bienestar psicolgico es el grado de satisfaccin que tiene el sujeto con la forma de vida que lleva y que llev hasta ese momento. La satisfaccin es un constructo tridico en el cual se consideran los estados emotivos, el componente cognitivo y las relaciones vinculares. BIEPS es una prueba autoadministrable que se basa en la propuesta terica de Ryff quien destaca la multidimensionalidad del bienestar Psicolgico. Esta prueba evala la percepcin subjetiva del bienestar psicolgico y permite diferenciar a sujetos que han logrado determinado nivel de bienestar de aquellos que presentan sntomas y signos que dan cuenta de la presencia de malestares en grado moderado o severo. Su estudio debe tomar en cuenta las siguientes dimensiones: 1. Autoaceptacion: Apreciacin positiva de si mismo. Actitud positiva hacia la vida personal presente y pasada. 2. Control de situaciones y autonoma: Capacidad de manejar apropiadamente el medio y la propia vida; y sentido de autodeterminacin. 3. 4. 5. Vnculos psicosociales: Calidad de vnculos personales y afectivos significativos. Proyectos: Metas y propsitos de la vida propia. Aceptacin del crecimiento y desarrollo de la vida.
Se encontr que la estructura factorial del BIEPS-J para adolescentes, confirma la presencia de cuatro factores que se corresponden con las subescalas del BIEPS-A a excepcin de la dimensin Autonoma. As mismo, con el mismo anlisis factorial se eliminaron siete tems por presentarse en ms de un factor. La prueba final, entonces qued conformada por trece tems agrupados en cuatro factores:
61
1. Aceptacin de s. 2. Vnculos Psicosociales. 3. Proyectos. 4. Control de situaciones. Por su parte, el SCL 90 R es un inventario desarrollado para evaluar patrones de sntomas presentes en los individuos. Est constituido por 90 tems que se responden sobre la base de una escala de cinco puntos (cero a cuatro). No requiere ms de quince minutos y se le pide al sujeto que responda en funcin de cmo se ha sentido durante los ltimos siete das, incluyendo el da de la administracin. El puntaje y la evaluacin se realizan en funcin de nueve dimensiones primarias y tres ndices globales. Las dimensiones primarias son: 1. Somatizaciones: Presencia de malestares que la persona percibe relacionadas con diferentes disfunciones corporales. 2. Obsesiones y compulsiones: Pensamientos, acciones e impulsos que son vivenciados como imposibles de evitar. 3. Sensitividad interpersonal: Sentimientos de inferioridad e inadecuacin. 4. Depresin: Manifestaciones como falta de motivacin y poca energa mental. 5. Ansiedad: Signos de nerviosismo y miedo. 6. Hostilidad: Pensamientos, sentimientos y acciones con afectos negativos de enojo. 7. Ansiedad fbica: Respuestas de miedo desproporcionadas con respecto al estmulo que lo provoca. 8. Ideacin paranoide: Comportamientos paranoides en tanto desordenes del pensamiento, temor a la prdida de autonoma. 9. Psicoticismo: Sntomas referidos a estados de soledad, alucinaciones, etc. Los ndices globales son: 1. ndice de severidad global: Es un indicador del nivel de la severidad del malestar. Se calcula sumando las puntuaciones obtenidas en las nueve dimensiones de sntomas y en los tems seleccionados.
62
2. Total de sntomas positivos: Se estima contando el total de tems que tienen respuesta positiva. Ej. Puntuacin bruta en Varones = 3 y Mujeres = 4; supone un intento de mostrarse mejor que lo que estn. Puntuaciones brutas en Varones = 50 y Mujeres = 60; supone una tendencia a exagerar sus patologas. 3. ndice de malestar positivo: Pretende evaluar el estilo de respuesta indicando si la persona tiende a exagerar o a minimizar los malestares que lo aquejan. Se calcula dividiendo la suma total de las respuestas dadas en los tems por el valor obtenido en sntomas totales positivos. La conversin del puntaje bruto o directo, es a puntaje T. Se considera que una persona en riesgo tiene una puntuacin T que sea igual o mayor a 65. Por su parte, se considera la presencia de una patologa severa cuando la puntuacin T, es igual o mayor a 80. Los baremos son construidos segn los sexos, y el inventario se puede aplicar en personas de 13 a 65 aos. Por ltimo, sirve para fines de diagnstico clnico, mbitos educativos, comunitarios, etc.
63

Curso Básico de Psicometría

Cargado por

Copyright:

Formatos disponibles

Curso Básico de Psicometría

Cargado por

Información del documento

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Curso Básico de Psicometría

Cargado por

Copyright:

Formatos disponibles

Curso Bsico de Psicometra

También podría gustarte