U4l3 Aragon 2004 Fundamentos Psicometricos en La Evaluación Psicologica
U4l3 Aragon 2004 Fundamentos Psicometricos en La Evaluación Psicologica
U4l3 Aragon 2004 Fundamentos Psicometricos en La Evaluación Psicologica
es decir, a detectar la presencia de un estado, un conocimiento, una que sea útil nos debe proporcionar los elementos suficientes para determinar
patología, etc., de acuerdo al campo en donde se esté evaluando. En un tanto el método modificativo en cada caso concreto así como poder verificar la
sentido amplio, el término de evaluación no se restringe sólo a diagnóstico, efectividad del mismo una vez utilizado (Pawlik, 1980).
sino a todo un proceso cuya meta consiste en identificar, rotular, seleccionar, A este tipo de diagnóstico que utiliza la estrategia modificativa –en oposición al
plantear objetivos, intervenir, pronosticar y volver a evaluar si los objetivos que usa la estrategia selectiva y que presupone por tanto que el individuo
planteados se alcanzaron; su finalidad estriba sobre todo en su utilidad para la posee la cualidad evaluada como un rasgo permanente de su conducta-, se le
toma de decisiones. llama diagnóstico de proceso, en el que se considera que la conducta es
Desde este punto de vista entonces, la evaluación psicológica no se conforma susceptible de cambiar a través de diferentes procesos modificativos. Sin
únicamente con aplicar algún tipo de prueba o instrumento con la finalidad de embargo, sea el diagnóstico del tipo que sea, el objetivo final que persigue
conocer el estado actual de un sujeto o grupo de sujetos en cuanto a algún toda evaluación es la toma de decisiones. Esta toma de decisiones presupone
atributo o problema psicológico, sino que va más allá y éste sólo sería el la existencia de alternativas entre las cuales hay que elegir. Se podría
primer paso de un proceso que involucra una toma de decisiones que considerar entonces a la intervención psicológica como todo aquello que al
comprende, a su vez, seleccionar y plantear objetivos de terapia, seleccionar final de un proceso evaluativo se puede implementar como consecuencia de
las técnicas y estrategias para la intervención, evaluar continuamente para dicho proceso.
constatar que los objetivos planteados se van alcanzando así como para
detectar posibles problemas en su consecución y evaluar para ver si las Medición
metas finales se han alcanzado. De este modo, la evaluación no representa
por tanto un fin en sí misma sino que persigue un objetivo eminentemente
El objetivo final de toda ciencia es describir, explicar y predecir los fenómenos
práctico y como tal está al servicio de la disciplina: su objetivo fundamental no
que estudia; para lograr este objetivo, la ciencia debe recoger y comparar
es la explicación sino la búsqueda de medidas prácticas de intervención.
datos que permitan fundamentar sus teorías. La medida es el componente
La importancia de la evaluación psicológica entraña un concepto muy
esencial de este proceso; la medición es lo que le ha permitido a la psicología
importante que se refiere a las inferencias que de ella pueden derivarse,
alcanzar el status de ciencia y no sólo ser considerada como una doctrina
inferencias basadas en las respuestas que se dan en la situación de
psicológica. La medición es por tanto una actividad prioritaria tanto en la
evaluación. Como mínimo, el proceso de evaluación supone que la conducta
ciencia psicológica en general como en la evaluación psicológica en particular;
a evaluar por medio de algún instrumento específico, es una muestra de los
el proceso de medición es el que le permite a una disciplina alcanzar el estatus
repertorios de conducta que el evaluado posee; representa lo que el individuo
de ciencia ya que, una vez que se pueden medir sus datos, se pueden
ha aprendido como resultado de su interacción con el entorno social.
comparar, replicar, establecer modelos matemáticos para su explicación y
Sin embargo, así como no todas las evaluaciones son iguales, tampoco lo son
realizar investigaciones controladas. La pregunta a resolver sería: ¿qué
sus fines. Al respecto, podemos considerar que dentro del proceso de
medimos en psicología y cómo es que lo medimos?
evaluación psicológica existen estrategias selectivas y estrategias
modificativas; dentro de las primeras se busca la optimación a través de la
selección adecuada ya sea de personas –en determinadas condiciones, elegir ¿Qué Medimos En Psicología?
a las personas con un criterio de ejecución o clasificarla de acuerdo a dicho
criterio- o de condiciones –se parte de unos individuos concretos y la La respuesta más sencilla a esta pregunta es: lo que medimos en psicología
estrategia consiste en buscar las condiciones idóneas que mejor se adapten a es la conducta, el comportamiento. Pero la respuesta no nos dejaría
cada uno de ellos de acuerdo al criterio de optimación-. Por otra parte, en la satisfechos ya que por ejemplo, no tiene el mismo nivel de dificultad el medir
estrategia modificativa se busca una forma de actuar buscando la optimación una conducta como “fumar”, “hacer berrinche”, que las conductas de
a través de la modificación tanto de las conductas de las personas como de “palpitaciones por nerviosismo” o “estudiar” o “estar triste”; en realidad, no
las condiciones. Dentro de esta última estrategia se debe considerar que para podemos medir esas conductas de manera directa ni absoluta, y entonces,
más que conductas, lo que medimos son “atributos de la conducta” o asignar valores numéricos a los sujetos, sobre la base de sus respuestas
“atributos psicológicos”. Por otra parte, aunque conductas como “fumar” sea (Muñiz, 1992)
fácilmente medible, a la psicología le interesaría primordialmente el
componente psicológico de la conducta de fumar ya que esta conducta tiene Teoría Clásica De Los Tests
otros componentes: biológico, físiológico, motor, etc.; así, de la conducta de
fumar, nos interesaría el componente psicológico o atributo psicológico, por
La psicometría es una rama relativamente muy joven de la psicología; se
ejemplo, la dependencia psicológica hacia el cigarrillo, las cognitivas que el
origina con los primeros trabajos de Spearman de 1904 a 1913 (Muñiz, 1992),
sujeto presenta tanto cuando se va a fumar el cigarro como cuando no puede
cuyo objetivo era encontrar un modelo estadístico que fundamentase las
hacerlo, otras conductas que desencadenan tal conducta, las consecuencias
puntuaciones de los tests y permitiera la estimación de los errores de medición
tanto agradables como aversivas del hecho de fumar, etc.
asociados a todo proceso de medición. A este modelo se le conoce como el
Para que quede un poco más clara la distinción entre medir un objeto o un
modelo lineal clásico de Spearman, y es el que todavía en la actualidad
atributo, digamos que cuando medimos una mesa (que es un objeto físico),
perdura en la Teoría Clásica de los Tests, y se expresa como:
más que la mesa como tal, medimos ciertos atributos de ella: su largo, su
ancho, su altura; del mismo modo, cuando medimos personas o X=V+e
en donde X es la puntuación empírica de un sujeto, V es la puntuación
comportamientos, no los medimos totalmente, sino sólo ciertos atributos
verdadera y e es el término de error. De aquí se sigue que la puntuación de un
psicológicos que nos interesan: motivación, ansiedad, depresión, inteligencia,
sujeto en una prueba es igual a la puntuación verdadera, que nunca se puede
afrontamiento, personalidad, fumar, etc. Sin embargo, a diferencia de la mesa
conocer, más el error de medición; que mientras más confiable sea la prueba y
en que los atributos largo, ancho o altura los podemos medir directamente por
por tanto menor sea el error, la puntuación empírica se acercará más a la
medio de un instrumento que mida longitud, muchos de los atributos
puntuación verdadera. Reconocer que toda medida psicológica, al igual que
psicológicos no los podemos medir directamente, sino sólo los podemos medir
las medidas de la ciencia contienen un término de error, fue un gran avance
indirectamente, por eso se habla de que los atributos psicológicos se miden a
para la evaluación psicológica, ya que entonces se empieza a considerar que
través de indicadores; esto es, instrumentos que nos van a mostrar
no basta el juicio humano para determinar los atributos psicológicos, y que los
indirectamente el atributo que pretendemos medir.
instrumentos de evaluación psicológica deben intentar, al igual que los
instrumentos de las ciencias físicas, medir con precisión.
Psicometría Y Teoría De La Medida
Se reconoce así la necesidad primero de establecer y luego de medir la
confiabilidad y la validez de los instrumentos psicológicos, así como las
Así como en las ciencias físicas la elaboración de instrumentos se deriva de la recomendaciones técnicas tanto para la elaboración de tests como para su
teoría en la que están inmersos y de una tecnología que permite medir sus uso, temas ignorados hasta ese momento. Entonces, para poder considerarlos
objetos de estudio, los instrumentos de evaluación psicológica responden a adecuados y científicos, los instrumentos de todas las ciencias deben contar
una teoría de la medida; como dice Martínez (1996), los instrumentos de con dos requisitos indispensables y la psicología no es la excepción: la
medición psicológica necesitan demostrar su utilidad y validez científica. En confiabilidad y la validez.
psicología, la psicometría es la que garantiza que los instrumentos de
medición elaborados cuenten con las garantías científicas para su uso. La Confiabilidad
psicometría es el conjunto de métodos, técnicas y teorías implicadas en la
medición de variables psicológicas; estudia las propiedades métricas exigibles
La confiabilidad en sentido amplio, es la exactitud, la precisión con que un
en las mediciones psicológicas y establece las bases para que dichas
instrumento de medición mide el objeto, en términos estrictos, la confiabilidad
mediciones se realicen de forma adecuada. El objetivo de la psicometría es
sería la ausencia de errores de medición utilizando un instrumento
proporcionar modelos para transformar los hechos en datos con la finalidad de
determinado; sin embargo, en psicología, es difícil utilizar dichos términos en medición y a la medida misma, por ejemplo, inteligencia, personalidad.
la medición de atributos psicológicos. Como alternativa se utilizan como Otro tipo de validez es la de criterio, que puede ser concurrente o predictiva, y
sinónimo de confiabilidad el de estabilidad de la medida y el de consistencia se refiere a que la medida obtenida por un sujeto en la prueba nos va a ayudar
interna (Muñiz, 1992). La estabilidad de la medida se refiere a que, al medir a predecir, en el tiempo presente o a futuro, un comportamiento, es la eficacia
un atributo psicológico con un determinado instrumento, éste será confiable si, de un test en la predicción de situaciones específicas; se compara la actuación
al evaluar a los mismos sujetos con el mismo instrumento, las medidas del sujeto en un test con un criterio, con una medida directa e independiente
obtenidas en la segunda aplicación sean muy similares a las obtenidas en la de lo que está destinado a medir; debe existir evidencia de que hay una
primera aplicación, esto es, sean estables a través del tiempo, lo cual indicaría relación entre las puntuaciones del test y las del criterio, por ejemplo aptitudes
que los errores de medición serían mínimos y por tanto la confiabilidad sería para el aprendizaje, preferencias vocacionales, selección de personal, un
aceptable, atribuyéndose las diferencias encontradas entre una medición y diagnóstico clínico.
otra a los errores aleatorios asociados al proceso de medición y no al Finalmente la validez de contenido es el grado en que un conjunto de reactivos
instrumento (Muñiz, 1992). representan adecuadamente un dominio de conductas; es una muestra
Por otro lado, la consistencia interna se refiere a que, en un instrumento dado, representativa de un contenido teórico de conocimientos, habilidades o
los reactivos que lo componen son consistentes entre sí en la forma en que conductas; mide una muestra representativa de un contenido teórico de
están evaluando el atributo psicológico propuesto, esto es, en aquellos sujetos conocimientos o habilidades, y en este tipo de validez se garantiza que los
que puntean alto en el atributo, los sujetos de manera individual puntearán resultados del sujeto en la prueba, se puedan generalizar al universo de
alto en aquellos reactivos que tienden a medir dicho atributo y puntearán bajo contenido que la prueba representa, por ejemplo, rendimiento escolar, hábitos
en aquellos que no lo miden, siendo así consistentes los reactivos entre sí en de estudio, errores de tipo disléxico, ansiedad, habilidades sociales.
la evaluación del atributo a evaluar. De esta manera, tanto la confiabilidad como la validez son dos requisitos
indispensables que debe poseer todo instrumento de evaluación psicológica, lo
Validez cual nos garantizará el poder usarlo confiablemente y asegurar que las
inferencias y decisiones que de ellos se deriven, serán las más apropiadas.
La validez es el grado en que un instrumento de medición mide realmente lo
Clasificación De Los Tests
que se propone; es el grado de adecuación, significación y utilidad de las
inferencias específicas que pueden derivarse a partir de las puntuaciones de
los tests, teniendo en cuenta que lo que se valida no es el instrumento, sino la No todos los instrumentos de evaluación psicológica son iguales; podemos
interpretación de los datos obtenidos por medio de él (Martínez, 1996). En clasificarlos de acuerdo a su interpretación, a su forma de comparación, a su
este sentido, la validez se refiere principalmente a la utilidad de los datos finalidad, a su modo de aplicación, a su forma de aplicación y al área del
proporcionados por el instrumento, a las inferencias que podemos deducir de comportamiento que miden.
la ejecución del sujeto en una prueba. De acuerdo a la interpretación, las pruebas se dividen en pruebas objetivas y
Existen tres tipos de validez: de constructo, de criterio y de contenido, y de pruebas subjetivas. Las pruebas objetivas nos proporcionan tablas y medidas
acuerdo a la validez que posea un instrumento determinado, en esa medida de comparación de los sujetos contra los cuales comparar su ejecución; dichas
podemos realizar inferencias sobre la conducta posterior del sujeto evaluado tablas y medidas nos permiten interpretar los resultados de una manera clara,
(Aragón y Silva, 2002). Así, en la validez de constructo, que valida un rasgo objetiva, no ambigua y la interpretación no depende del juicio del evaluador.
teórico o constructo hipotético, se validan las cualidades o rasgos psicológicos Así, la ejecución de un sujeto arrojaría los mismos resultados y por tanto sería
que mide el test y se valida no sólo el rasgo sino la teoría sobre la que éste interpretada de la misma manera por dos evaluadores diferentes, esto es,
descansa; lo que implica que el instrumento mide un constructo o rasgo independientemente del evaluador (por ejemplo, prueba de inteligencia WISC-
teórico derivado de toda una teoría psicológica, subyacente al instrumento de RM, prueba de personalidad 16PF, prueba MMPI, prueba de percepción
evaluado con su grupo de comparación, son la media más y menos una emocionalmente estable y maduro, dominante, bastante autocontrol, ansiedad;
desviación estándar, lo cual significa que se le compara con la ejecución que situando a las puntuaciones intermedias: 4, 5, 6 y 7 como poseedor del rasgo
realiza el 68.26% de la población para determinar lo adecuado o no de su en términos medios, como lo poseen el 68.2% de la población, y que lo
comportamiento. Claro está que por ejemplo, si el individuo se encuentra por demuestran en mayor o menor grado según el contexto en el que se
arriba de ese 68.26% esto no sería un problema sino por el contrario, una encuentren.
ventaja; por otro lado, aquel individuo que se encontrara por debajo de esa Sin embargo, como no es factible que toda prueba construida se distribuya
puntuación que obtiene el 68.26% de los casos, en realidad se encontraría por normalmente al aplicarla a la población meta -que son la mayoría-, las
abajo del 84.08% de la población (abajo del 68.26% más los que se puntuaciones que se utilizan son los percentiles (o centiles), que son las
encuentran por arriba de ellos a la derecha de la curva normal), lo cual es un puntuaciones derivadas de una distribución de frecuencia acumulada y dividida
fuerte indicador de que existe un problema. Por ejemplo, si un niño de siete en 100 partes, encontrándose en cada parte o percentil de la distribución el
años no resuelve el número de problemas de aritmética que resuelven el 84- mismo número de casos, a diferencia de la curva normal, en que cada parte de
08% de niños de su edad, esto nos da pie para pensar que quizás a eso se la curva tiene un porcentaje diferente de población. Algunos percentiles
debe su bajo rendimiento académico. importantes son la mediana y los cuarteles primero y tercero.
Los decatipos son también puntuaciones derivadas de una distribución de La mediana (el percentil 50) es el punto de una distribución de frecuencias
curva normal, sólo que, en lugar de tener la forma de campana de Gauss, es acumulada que divide a la población en dos partes iguales, esto es, por arriba
una curva normal planocúrtica, esto es, aplanada, en las que, en lugar de y por debajo de la mediana se encuentra el 50% de los casos. Los cuartiles
dividirse la curva en seis partes (la media más y menos tres desviaciones dividen a la distribución de frecuencia acumulada en cuatro partes iguales,
estándares), se divide en 10 para los decatipos (la media más y menos cinco encontrándose en cada cuartil el 25% de la población; así, por debajo del
desviaciones estándares), variando los porcentajes de población que se cuartil uno (percentil 25), se encuentra el 25% de la población que obtuvo las
encuentran dentro de cada porción. En los decatipos 1 y 10 se encuentra el puntuaciones más bajas y por arriba del tercer cuartil (percentil 75), se
2.3% de la población, en los decatipos 2 y 9 se encuentra el 4.4%, en los encuentra el 25% de la población que obtuvo las puntuaciones más altas.
decatipos 3 y 8 el 9.2%, en los 4 y 7 el 15% y en los decatipos centrales, 5 y De esta manera, si al aplicar una prueba a la población meta sus puntuaciones
6, se encuentra el 19.1% de la población. La interpretación se basa tomando no se distribuyen normalmente, entonces es conveniente elaborar una
como norma de comparación los cuatro decatipos centrales: el 4, 5, 6 y 7 y distribución de frecuencias acumuladas y determinar los diferentes percentiles,
considerando entonces puntuaciones extremas los decatipos 1, 2 y 3 del lado tomando en cuenta que los percentiles de comparación serán el 25 y el 75, ya
izquierdo de la curva (que representarían al 15.9% de la población con que entre ellos se encuentra el 50% de la población con puntuaciones
puntuaciones más bajas) y los decatipos 8, 9 y 10 a la derecha (el 15.9% con intermedias, es decir, es la mitad de la población que se encuentra en medio
las puntuaciones más altas). de la distribución, y con ella se va a comparar la ejecución de los demás
Un ejemplo de prueba que se distribuye de esta manera es la serie de evaluados. Así, si un sujeto al aplicarle una prueba de inteligencia se
pruebas de personalidad elaborada por R.B.Cattell: el cuestionario de 16 encuentra en el percentil 60, esto querría decir que se encuentra por arriba del
factores de personalidad o 16PF, el HSPQ, el CPQ y el ESPQ, que evalúan 60% de la población en el rasgo evaluado y que a su vez el 40% tiene una
personalidad a personas mayores de 16 años, a adolescentes de 12 a 16 ejecución mejor que él; si se encuentra en el percentil 85, su ejecución se
años, a niños de 8 a 12 años y a niños de 6 a 8 años, respectivamente. Al encuentra por arriba del 85% de los chicos de su edad y sólo por abajo del
seguir las puntuaciones de esta prueba una distribución de curva normal de 15% de la población, y si su percentil es de 20, entonces esto indicaría que su
decatipos, Cattell interpreta los decatipos 1, 2 y 3, como el polo negativo del ejecución se encuentra por abajo del 80% de la población normativa. Si
factor o rasgo de personalidad que está evaluando, por ejemplo: reservado, estamos evaluando ansiedad, entonces encontrarse en el percentil 25 o menos
baja capacidad mental escolar, poca estabilidad emocional, sumisión, poco no sería un problema, pero sí encontrarse en el percentil 75 o más arriba, ya
autocontrol, relajado; contrastándolos con el polo positivo que correspondería que indicaría que el sujeto evaluado sobrepasa al 75% o más de la población
a los decatipos 8, 9 y 10: afectuoso, alta capacidad mental escolar, en ansiedad. Las normas aceptadas universalmente para determinar lo