Cap02 Cohen
Cap02 Cohen
Cap02 Cohen
2
Consideraciones históricas, culturales
y ético/legales
Continúa nuest<a cevisión prnfunda del campo de las pmebas y la evaluación psicológica con una
mirada retrospectiva para lograr apreciar mejor el contexto histórico de lo que estas actividades
implican. Además, se presenta conocimiento que invita a la reflexión respecto a cuestiones cul-
turales y ético/legales. Considere este "alimento" sólo como un aperitivo; material sobre consi-
deraciones históricas, culturales y ético/legales están entrelazadas con otros textos a lo largo de
este libro, cuando esto es apropiado.
31
Figura 2-1
Puestos de pruebas en China
Aquí se retratan cientos de cubículos de examinación de servicio civil en Nanking. Las pruebas duraban días y los
examinados en ocasiones morían por la tensión generada. Esta fotografía fue tomada alrededor de veinte años después
de que cesaran estas pruebas en 1905.
el nepotismo sin duda era cosa común, es admirable ver a una sociedad donde el empleo se basaba
en exámenes competitivos y abiertos. Los lectores modernos podrían notar con fascinación que ac-
tividades como la arquería y la equitación estaban incluidas dentro de estas pruebas. Sin embargo,
los usuarios de las pruebas de aquel entonces consideraban que los servidores civiles debían ser
diestros en la aplicación de esas habilidades.
Son fascinantes desde el punto de vista histórico, los escritos
grecolatinos que propusieron diversas bases fisiológicas para la
construcción y por tanto para el análisis de la personalidad y del
Una pregunta "dlagnóstiea11 de suma temperamento. También pueden ser intrigantes, los intentos que se
importancia durante ra Edao,Media era; dieron en la Edad Media para responder cuestiones diagnósticas
con
"¿Ouién EtS!á aliad.o el dernonior' ¿CUát de importancia crítica para la sociedad d e la época, como "¿Quién
cree usted, m1.nHiS la pregunta más importante está poseído por el demonio?" Sin embargo, no fue sino hasta el
para ha~er en un diagnóstico en ,1a actualidad? Renacimiento cuando comenzó a surgir la medición en las ciencias
conductuales, tal y como la reconocemos en la actualidad. Para el
siglo XVIII, Christian von Wolff (1732, 1734) había anticipado que la
psicología pudiese ser una ciencia y concibió a la medición psicológica corno un área d e especia-
lización dentro d e esa ciencia.
El siglo XIX
En 1859 se publicó un libro titulado Del origen de las especies por medio de la selección natural escrito
por Charles Darwin (1809-1882). En esta importante obra de consecuencias trascendentales,
Darwin afirmaba que la variación azarosa en las especies sería seleccionada o rechazada por
la naturaleza de acuerdo con el valor adaptativo y de supervivencia determinado en cada es-
pecie. Más tarde argumentaba que los humanos descendían del mono como resultado de esas
variaciones genéticas dadas al azar. Esta idea revolucionaria d esp ertó interés, admiración y una
gran cantidad de enemistades; ésta sobre todo de los miembros de la comunidad religiosa, los
cuales interpretaron las ideas de Darwin corno una afrenta para el relato bíblico de la creación
1. La influencia del pensamiento d e Darwin también es evidente en la teoría d e la personalidad formulada por Sigrnund
Freud. Desde una perspectiva darwiniana, serían las personas más fuertes con los impulsos sexuales dominantes las que
habrían tenido mayor responsabilidad en la contribución a la reserva d el gene humano. En este contexto, puede entender-
se mejor la noción de Freud de la importancia primordial de los impulsos sexuales, instintivos y agresivos.
Figura 2-2
Los Cattell, James McKeen y Psyche
El psicólogo que acuñó el término prueba mental, James McKeen Cattell (1860-1944), a menudo ha recibido crédito
por error (junto con otro psicólogo, Raymond B. Cattell, sin parentesco) como el autor de una medida de inteligencia
infantil llamada Escala de inteligencia infantil de Cattell (Cattell lnfant Intelligence Scale; CIIS). En realidad,fue
Psyche (1893-1989), la tercera de siete hijos de Cattell y su esposa, Josephine Owen, quien creó la CIIS. De 1919
a 1921, Psyche asistió a su famoso padre en los análisis estadísticos para la tercera edición de American Men of
Science. En 1927, obtuvo su título de doctora en educación en Harvard. En 1931, adoptó un hijo, convirtiéndose en
una de las primeras mujeres solteras en hacerlo (Sokal, 1991). Más adelante en esa misma década adoptó una hija.
Su libro Toe Measurement of Intelligence in lnfants and Young Children se publicó en 1940 y fue en ese libro
donde se introdujo la CIIS. Más tarde en su carrera, escribió un libro popular, Raising Children with Love and
Limits, el cual refutaba la tolerancia que era manejada por las autoridades en la crianza de los niños como Benjamín
Spock.
El siglo XX
::..OS comienzos del siglo XX atestiguaron el nacimiento de las primeras pruebas formales de inte-
ligencia. Como se verá en el resto de esta sección, al inicio hubo una gran receptividad para los
:nstrumentos que supuestamente podían medir características mentales; al principio, inteligencia
y más adelante otras características como aquellas relacionadas con la personalidad, intereses,
actitudes y valores.
La medición de la inteligencia Gran parte de las pruebas del siglo XIX que podrían describirse
como de naturaleza psicológica implicaban la medición de capacidades sensoriales, tiempo de
:-eacción y cosas por el estilo. Una persona que tuvo la visión de ampliar las pruebas para incluir
:a medición de capacidades cognoscitivas fue Alfred Binet (1857-1911). Ya desde 1895, Binet y su
colega Víctor Henri publicarían varios artículos en los que abogaban por la medición de capaci-
d ades como la memoria y el manejo de habilidades sociales. Diez
años después, Binet y su colaborador Theodore Simon publica-
rían una "escala de medición de la inteligencia" que constaba de SÓLO PIENSE ., .
30 reactivos diseñados para ayudar a identificar a niños en edad Aprincipios del siglo xx, la prueba de Binet
escolar con deficiencia mental en París (Binet y Simon, 1905). La fue utilizada en todo el mundo cmn vanas
prueba de Binet pasaría por muchas revisiones y traducciones, propósitos además de identificar alos ni®s
y en el proceso generaría tanto el movimiento de las pruebas de excepciOrnide.s ·@íl las esouelas de París. ¿Cuál
inteligencia como el movimiento de las pruebas clínicas. En bre- cree ·usted que fu.eran ot:f-OS usos que se le
ve, las pruebas psicológicas fueron utilizadas en escenarios tan la
dieron a nroeba? ¿Qué tan apropiado ffl'ee
diversos como tribunales para menores, reformatorios, prisiones, quefue util!Zár ia p-rueba para estos otros
orfanatos y escuelas (Pintner, 1931). propüsitos?
En 1939, David Wechsler, un psicólogo clínico del Hospital
Bellevue en la ciudad de Nueva York, introdujo una prueba dise-
ñada para medir la inteligencia de los adultos, definida como "la capacidad agregada o global del
individuo para actuar en forma propositiva, para pensar en forma racional y para enfrentarse en
forma efectiva con su ambiente" (p. 3). La prueba, originalmente llamada Escala de inteligencia
Wechsler-Bellevue, fue revisada y se le cambió el nombre a Escala Wechsler de inteligencia para
adultos (Wechsler Adult Intelligence Scale; WAIS). La prueba llamada WAIS ha sido revisada
La medición de la personalidad La gran acogida que tuvieron las pruebas de capacidad intelectual
fomentó la elaboración de una diversidad de pruebas utilizadas para medir variados conceptos
psicológicos (Garrett y Schneck, 1933; Pintner, 1931) por tanto, ocho años después de la publica-
ción de la escala de Binet, el campo de la psicología era severamente criticado por estar demasia-
do orientado hacia el manejo de las pruebas (Sylvester, 1913). Para finales de la década de 1930,
aproximadamente cuatro mil diferentes pruebas psicológicas estaban disponibles (Buros, 1938) y
. el término "psicología clínica" era sinónimo de "pruebas mentales" (Institute for Juvenile Resear-
ch, 1937; Tulchin, 1939).
La primera guerra mundial no sólo trajo la necesidad de explorar el funcionamiento intelec-
tual de los reclutas sino también la relacionada con la necesidad de explorar sus posibles pro-
blemas d e personalidad, entonces, al Comité sobre Salud Emocional (Committee on Emotional
Fitness) del gobierno, presidido por el psicólogo Robert S. Woodworth, se le asignó la tarea de
elaborar una medida de adaptación y estabilidad emocional que pudiera administrarse con ra-
pidez y eficiencia a grupos de reclutas. El Comité elaboró diversas versiones experimentales de
lo que en esen cia eran entrevistas psiquiátricas transcritas. Para disfrazar el propósito verdadero
de la prueba, el cuestionario fue denominado Hoja de datos personales (Personal Data Sheet). Se
les pedía a los reclutas y voluntarios que indicaran "sí" o "no" a una serie de preguntas que de-
mostraban la existencia de varias clases de psicopatología. Por ejemplo, una de las preguntas en
la prueba era:"¿Le preocupa la idea de que la gente lo esté observando en la calle?"
La Hoja de datos personales elaborada por Woodworth y sus colegas nunca pasó de las eta-
pas experimentales, ya que el armisticio que dio fin a la guerra p recedió a la forma final de la
prueba. Después de la guerra, Woodworth elaboró una prueba de
personalidad para uso civil basada en la Hoja de Datos Personales
y la llamó Inventario psiconeurótico de Woodworth (Woodworth
Describá al candidato ,ideal para laeváfuación Psychoneurotic Inventory). Este inventario fue la primera prueba
!le: fia personalidad a través deun autMeporte, de personalidad basada en un informe personal, usada en forma
extensa, un m étodo de evaluación que pronto sería empleado de
diversas formas en sucesivas pruebas d e personalidad.
Las pruebas de personalidad que emplean metodologías de informe personal tienen ventajas
y desventajas. Por una p arte, se afirma que la persona que responde la pregunta es la m ás califica-
da para proporcionar respuestas sobre sí misma. Por otra parte, existen argumentos en contra d e
las personas que proveen tal información. Por ejemplo, éstas pueden tener un vago conocimiento
sobre sí mismas. Es decir, pueden honestamente creer algo sobre sí mismas que en realidad no es
cierto. Sin importar la calidad del conocimiento que tengan sobre sí mismas, algunas person as no
están dispuestas a revelar información muy personal o que los haga quedar en una posición nega-
tiva. Dadas las deficiencias de la evalu ación de la personalidad basadas en el método de informe
personal (autoinforme), existía una n ecesidad para crear pruebas de personalidad alternas.
Cultura y evaluación
Cultura puede definirse como "los patrones de comportamiento, creencias y productos del tra-
bajo de una población, comunidad o grupo de personas particular transmitidos en forma social"
Cohen, 1994, p. 5). Tal como nos es enseñada por nuestros padres, nuestros grupos de pares
e instituciones sociales tales como las escuelas, la cultura preescribe muchos comportamientos
y formas de pensamiento. El lenguaje hablado, las actitudes hacia los ancianos y las técnicas
de crianza de los hijos son sólo algunas manifestaciones críticas de la cultura. La cultura en-
seña rituales específicos que han de realizarse en el nacimiento,
matrimonio, muerte y otras ocasiones trascendentales. Asimismo,
comunica mucho sobre lo que debe valorarse o apreciarse, y lo SÓló PIEN$E., ;
que debe rechazarse o despreciarse. La cultura enseña un punto ¿Puede pensar una od® formas en que
de vista respecto a lo que significa nacer con uno u otro género, uste.ct füi 1:m producto de su cultura? ¿De qué.
raza o antecedentes étnicos. La cultura nos enseña algo sobre lo maner~ esto se pt:Jed~ verificar en una prueba
que podemos esperar de otras personas y lo que podemos esperar psiaológ'ica?
de nosotros mismos. En efecto, la influencia de la cultura sobre los
minoritarias, tuvieran tendencia a obtener calificaciones inferiores como grupo, que las personas
d el grupo o cultura para la que se elaboró y estandarizó la prueba. Como un ejemplo específico,
considere este reactivo de la escala WISC publicada en 1949: "Si tu madre te manda a la tienda
?Or una hogaza de pan y no hay ninguna, ¿qué haces?" El que usted perciba o no algún pro-
blema con este reactivo, podría depender de su bagaje cultural. De hecho, el reactivo podría ser
problemático para niños de origen Hispano, muchos de los cuales podrían haber sido enviados
en forma rutinaria a la tienda a comprar tortillas. Supuestamente, muchos de ellos podrían NO
conocer el significado de la frase "hogaza de pan".
La traducción de los materiales de prueba para personas que hablan un idioma diferente de
aquel en el que la prueba se escribió inicialmente, comúnmente plantea varios problemas. Algu-
nos reactivos pueden ser más fáciles o más difíciles de lo que se pretendía originalmente cuando
se traducen en forma directa a otro idioma. Por ejemplo, el viejo reactivo de vocabulario mofeta de
!a Stanford-Binet habría sido cambiado para su administración en Puerto Rico, donde no existen
las mofetas. Algunos reactivos de vocabulario pueden cambiar de significado o tener diferentes
significados o aplicaciones cuando se traducen. Por ejemplo, considérese el reactivo de la WISC
u ¿Por qué la mayor parte de los puestos del gobierno deberían cubrirse por medio de exámenes?"
En algunos idiomas y culturas, la palabra exámenes se refiere de manera típica a exámenes médi-
cos. En esos casos, una mejor forma de plantear la pregunta del reactivo sería: "¿Por qué la ma-
yoría de los puestos de gobierno deben cubrirse mediante exámenes de habilidades y actitudes
de servicio?"
Comunicación verbal El lenguaje, el medio por el cual se comunica información, es una variable
clave, aunque a veces se ha pasado por alto en el proceso de evaluación. Lo que es más obvio,
el examinador y el examinado deben h ablar el mismo idioma. Esto es n ecesario no sólo para
que tenga lugar la evaluación, sino también para que las conclusiones del evaluador respecto
al evaluado y su ejecución, sean lo más precisas posibles. Si una prueba se presenta en forma
escrita con instrucciones completas, es obvio que quien responde la prueba debe ser capaz de
leer y comprender lo que está escrito. Cuando el idioma en que se realiza la evaluación no es el
idioma natal del evaluado, pueden surgir dudas respecto al grado de comprensión de las ins-
trucciones o reactivos que el examinado tenga. El peligro de ese malentendido puede aumentar
a medida que se use vocabulario, expresiones o idioma inusual. Aun cuando la evaluación se
pueda conducir con ayuda d e un traductor, también quedan dudas respecto a la comprensión
y al manejo de matices sutiles del significado de los reactivos que podrían perderse d e algu-
na manera en la t raducción. En ocasiones, los evaluados pueden intentar propositivamente
manipular deficiencias en el lenguaje para afectar los esfuerzos y resultados de la evaluación
(Stephans, 1992).
El dialecto hablado de un idioma también puede influir en los resultados de la prueba. Aun-
que, por ejemplo, en Estados Unidos se emplee el inglés americano estándar, en muchas comu-
nidades a lo largo del país se utilizan variantes y dialectos del inglés americano (Wolfram, 1971).
En entrevistas u otras situaciones en las que se h ace una valoración con base en un intercambio
oral entre dos partes, un examinador capacitado puede detectar a través de medios verbales o no
verbales que el dominio que el examinado tiene del idioma es deficiente. Esto no sucede con las
pruebas escritas. Se supone que todos aquellos a los que se les administra una prueba escrita son
capaces de leerla y comprenderla. De otro modo, la evaluación iría mas en relación a la destreza
en el uso del dialecto o lenguaje en lugar de cualquier habilidad, capacidad o rasgo de la perso-
nalidad que sea la que se pretende medir a través de la prueba.
Comunicación no verbal y conducta Los humanos no sólo se comunican por medios verbales sino
también a través de medios no verbales. Expresiones faciales, señas con los dedos y las manos
además de cambios en la posición o postura corporal del individuo pueden transmitir mensajes.
Por supuesto, los mensajes transmitidos por dicho lenguaje corporal pueden ser diferentes de
una cultura a otra. Por ejemplo, en la cultura estadounidense, alguien que no mira a los ojos a otra
persona cuando habla puede ser visto como signo de deshonestidad o como si se tuviera algo que
ocultar. Sin embargo, en otras culturas, esta falta de contacto ocular cuando se habla puede ser
una señal de respeto.
Si ha realizado o le han realizado una entrevista de trabajo, puede tener una idea de primera
mano del valor de la comunicación no verbal en un escenario de evaluación. Los entrevistados que
muestran entusiasmo e interés tienen una ventaja sobre quienes parecen estar soñolientos o aburri-
d os. En escenarios clínicos, un evaluador experimentado puede plantear hipótesis para probarlas
en la entrevista a partir del comportamiento no verbal del entrevistado. Por ejemplo, una persona
que anda con los hombros caídos, se mueve despacio y exhibe una expresión facial triste puede es-
tar deprimida. Pero por otro lado, este individuo puede estar experimentando malestar físico como
resultado de un espasmo muscular o un ataque de artritis. Será labor del evaluador determinar cuál
de estas hipótesis, si es que hay alguna, explica mejor el comportamiento observado.
Ciertas teorías y sistemas en el campo de la salud mental van más allá de las interpretaciones
más tradicionales del lenguaje corporal. Por ejemplo, en el psicoanálisis, una teoría de la perso-
nalidad y de tratamiento psicológico desarrollada por Sigmund Freud, se le asigna significado
simbólico a muchos actos no verbales. Desde una perspectiva psicoanalítica, el que un entrevis-
tado juegue nervioso con su anillo de bodas durante una entrevista puede interpretarse como
un mensaje relacionado con un matrimonio inestable. Como se evidencia en las ideas concebidas
sobre "las primeras acciones azarosas" de un paciente durante una sesión de terapia, Sigmund
Freud (1913) creía que podía inferir mucho sobre la motivación de la persona, a partir de la con-
ducta y el comportamiento no verbal:
Las primeras... acciones azarosas del paciente... revelarán uno de los complejos que rigen la neu-
rosis... Una joven... se apresura a tirar del dobladillo de su falda sobre su tobillo expuesto; ella ha
revelado el meollo de lo que el análisis descubrirá más adelante; el orgullo narcisista por su belleza
corporal y sus tendencias al exhibicionismo (p. 359).
Por cierto, esta cita de Freud también es útil para ilustrar la influencia de la cultura en las opi-
niones terapéuticas y de diagnóstico. Freud vivió en Viena en la época victoriana. En ese momento
y en ese lugar, el sexo no era tema para discusión pública. En muchas formas, las opiniones de
Freud respecto a la base sexual de diversos pensamientos y com-
portamientos eran producto de la cultura sexualmente reprimida
en la que vivía. sól.O PlE.lUL . .
Un ejemplo de un comportamiento no verbal en el que difie-
ren las personas, es la velocidad con la que se mueven de manera
Represente el papel de SigmundiFreud,como
característica para completar tareas. El ritmo de vida general en
se rluslr.a en el eld:raolo y cite un ejemplo de
un área geográfica, por ejemplo, es más rápido que en otra. En un
conducta; que crea que diga mucho sobre la
estilo parecido, hay diferencias en el ritmo de vida entre culturas
motivacíón del individuo.
y estas diferencias pueden servir para aumentar o disminuir las
puntuaciones obtenidas en pruebas que impliquen o manejen reactivos cronometrados (Gopaul-
McNicol, 1993; Knapp, 1960). En un sentido más general, Hoffman (1962) cuestionó el valor de
las pruebas de habilidad cronometrada, particularmente, aquellas en donde se manejaban reac-
tivos de opción múltiple. Él creía que este tipo de pruebas, se apoyaba más en la rapidez de res-
puesta del evaluado y por tanto, no se tomaban en cuenta ni se medían, aquellas características
Normas de evaluación Supóngase que los principales jefes de cocina de más de cien naciones par-
ticipan en una competencia efectuada para descubrir la mejor sopa de pollo del mundo. ¿Quién
cree que ganaría? La respuesta a esta pregunta depende de las normas de evaluación empleadas.
Si el único juez de la competencia fuera el dueño de una tienda kosher de platos preparados en el
lado este de Manhattan, el participante que se aproximara más a la variedad casera y preparada
11
al estilo judío" bien podría ser declarado ganador. Sin embargo, otros jueces podrían tener otros
estándares y preferencias. Por ejemplo, los conocedores de sopas de las culturas árabes bien po-
drían tener preferencia por una variedad de sopa de pollo que incluya jugo de limón fresco en la
receta. Los jueces de India podrían inclinarse por dar su voto a una sopa de pollo condimentada
con pimienta de India y otras especias exóticas. Para otros jueces asiáticos, la salsa de soya podría
ser vista como un ingrediente indispensable, y cualquier sopa preparada sin ella podría perder
por omisión. En última instancia, es probable que el caso no sea determinar cual sopa es superior
al resto ya que juzgar o determinar cuál sopa es mejor será una cuestión de preferencia personal
y de la norma de evaluación empleada.
Del mismo modo, los juicios relacionados con ciertos rasgos psicológicos también pueden ser
relativos desde un punto de vista cultural. Por ejemplo, el que patrones específicos de comporta-
miento sean considerados como apropiados para los hombres o para las mujeres dependerá de
las normas sociales prevalecientes respecto a la masculinidad y la feminidad. Por ejemplo, hay
algunas sociedades en las que se considera apropiado para las mujeres pelear en las guerras y
procurar el alimento mientras que los hombres se ocupan de actividades más domésticas.
El que patrones específicos de comportamiento sean considerados psicopatológicos depen-
derá de las normas sociales prevalecientes. En Sudán, por ejemplo, hay tribus que viven entre
el ganado porque consideran sagrados a los animales. Los juicios respecto a quién podría ser el
mejor empleado, gerente o líder, pueden diferir como una función de la cultura, así también los
juicios o la valoración y definición que se haga con respecto a la inteligencia, sabiduría, valor y
otras variables psicológicas.
Un reto inherente en la tarea de evaluar tiene que ver con mediar y equilibrar los resultados arro-
jados por la prueba y evaluación con los juicios o conceptos derivados de la cultura en tomo a dichas
habilidades o resultados obtenidos. En la práctica, esto significa plantear interrogantes sobre la apli-
cabilidad de los hallazgos relacionados con la evaluación a individuos específicos. Por tanto, además
de intentar responder cuestiones como 11¿qué tan inteligente es esta persona?" o 11¿qué tan asertivo
es este individuo?1', por medio de pruebas psicológicas, también deben plantearse algunas interro-
gantes adicionales. ¿Qué tan apropiadas al contexto y cultura son las normas u otros estándares que
se usarán para hacer la evaluación?, ¿en qué medida se ha asimilado el individuo en la cultura de la
que se extrajo la prueba y qué influencia podría tener dicha asimilación (o ausencia de ella) en los
resultados obtenidos?, ¿se han hecho investigaciones que avalen su aplicabilidad en la valoración
de este individuo en particular? De manera creciente, se están planteando estas cuestiones no sólo
entre los usuarios meticulosos de pruebas sino también en los manejos éticos de las mismas.
Psicología, pruebas y políticas públicas Poca gente se opondría a usar pruebas psicológicas en
contextos académicos y específicos que busquen el bienestar humano. Del mismo modo, p oca
gente está enterada del uso cotidiano que se les da a las pruebas psicológicas. De manera más
típica, los miembros del público en general están familiarizados con el uso de pruebas psicoló-
gicas en contextos de alto perfil, como cuando un individuo o grupo tiene mucho que ganar o
perder como resultado de la puntuación de una prueba. En esas situaciones, las pruebas y otras
herramientas de evaluación son vistas como instrumentos que pueden tener un impacto momen-
táneo e inmediato en la vida de una persona. En dicho momento, las personas pueden percibir
las pruebas como herramientas utilizadas para negarle a la gente cosas que necesita o desea. El
rech azo d e un avance educativo, la oportunidad de trabajo, la libertad bajo palabra o la custodia,
son algunas de las consecu encias más amenazantes que el público en general, p uede asociar con
pruebas psicológicas y los procedimientos de evaluación.
La sociedad civil pide a los legisladores y el personal involucrado en políticas públicas, que
los protejan de tales amenazas. Los legisladores aprueban leyes, las agencias administrativas o se-
cretarías hacen reglamentos, los jueces anuncian decisiones y los ciudadanos exigen referéndums
ya sea para reflexionar y aplicar las políticas públicas prevalecientes o para modificarlas. En la
siguiente sección, se amplía la visión de la tarea de la evaluación para incluir no sólo los intereses
de la profesión, sino los intereses del público en general.
2. Dejamos el problema de lo que se debe hacer cuando el capitán del barco es una mujer para referimos a un tomo dedi-
cado a la exploración a fondo de la ética de los marinos.
El 4 de octubre de 1957, los científicos del país conocido entonces como la Unión de Repúblicas Socialistas Soviéticas
lanzaron al espacio un satélite (que llamaron Sputnik). El evento fue recibido con sorpresa e incluso como un impac-
to por los estadounidenses. El prospecto de enemigo en una guerra fría que tenía a un satélite en órbita sobre la Tierra
veinticuatro horas al día era un acontecimiento sin precedentes. El lanz.amiento causó una amplia preocupación acer-
ca de la capacidad de Estados Unidos para competir en la nueva frontera del espacio. Se debía poner un mayor énfasis
en la educación, en particular en materias como matemáticas, ciencias, ingeniería y física. Y se harían esfuerzos más
grandes para identificar a los niños dotados que algún día aplicarían ese conocimiento en la carrera espacial.
velocidad en la que se estaban publicando los instrumentos, esta fuente requería de una actuali-
zación constante. Por tanto, Osear Buros no fue el primer profesional de la medición que empren-
dió una evaluación general de las pruebas. Sin embargo, fue el más tenaz en la actualización y
revisión de la información.
La difusión que se dio a las pruebas militares durante la década de 1940 como resultado de
la segunda guerra mundial no despertó tanto interés popular como lo hicieron las pruebas que se
llevaron a cabo durante la primera guerra mundial. En vez de eso, hubo un evento en una tierra
lejana que tendría un efecto momentáneo en las pruebas de Estados Unidos: el lanzamiento de un
satélite al espacio (véase figura 2-4).
Alrededor de un año después del lanzamiento del Sputnik, el Congreso de Estados Unidos apro-
bó la Ley de Educación para la Defensa Nacional (National Defense Education Act), la cual propor-
cionaba dinero federal a las escuelas locales con el propósito de realizar pruebas de capacidad y
aptitud en un esfuerzo por identificar estudiantes sobresalientes y talentosos desde el punto de vista
académico. Este evento provocó la proliferación subsecuente de programas de pruebas a gran escala
en las escuelas. Al mismo tiempo, el uso de pruebas de capacidad al igual que de personalidad para
la selección de personal aumentó en el gobierno, el ejército y las empresas. El amplio y creciente uso
de pruebas reanudó la preocupación pública, reflejada en artículos de revista como: "Testing: Can
Everyone be Pigeonholed?" (Newsweek, 20 de julio de 1959) y "What the Tests Do Not Test" (New York
Times Magazine, 2 de octubre de 1960). El resultado del aumento en la preocupación del público fue
la realización de audiencias legislativas sobre el tema de la evaluación (Amrine, 1965).
le!jislación Aunque la legislación resumida en la tabla 2-1 fue decretada a nivel federal, los es-
tados también aprobaron legislaciones que afectaron la tarea y actividad de la evaluación. En la
década de 1970, numerosos estados decretaron programas de pruebas de competencia mínima,
que se refieren a programas basados en pruebas formales y diseñados para tomarse en cuenta en
!as decisiones alrededor de varios aspectos de la educación de los estudiantes. Los datos de esos
? rogramas fueron utilizados en la toma de decisiones acerca de promociones de grado, premios
de diplomas e identificación de áreas para la instrucción de niños atrasados. Estas leyes surgieron
de la idea de que los graduados del bachillerato debían tener, al menos, "competencias mínimas"
en áreas como lectura, redacción y aritmética.
La legislación sobre la verdad en las pruebas también fue aprobada en el nivel estatal, co-
menzando en la década de 1980. El objetivo principal de estas leyes es proporcionar a quienes
responden las pruebas un medio para conocer los criterios contra los que se les está comparan-
d o. Para alcanzar este objetivo, algunas leyes ordenan la revelación de preguntas y respuestas
de las pruebas de admisión a la educación secundaria y en el nivel profesional dentro de los 30
días posteriores a la publicación de las calificaciones de la prueba. Algunas leyes requieren que
se conserve en el expediente información relevante acerca de la elaboración de la prueba y su
solidez psicométrica. Algunas leyes sobre la verdad en las pruebas requieren que se proporcio-
nen descripciones de 1) el propósito de la prueba y la materia de que trata, 2) el conocimiento y
capacidades que pretende medir la prueba, 3) los procedimientos para asegurar la precisión en la
calificación, 4) los procedimientos para notificar a quienes respondieron la prueba de los errores
en la calificación y 5) los procedimientos para asegurar la confidencialidad de quienes respondie-
ron la prueba, así como de los resultados obtenidos. Las leyes sobre la veracidad de las pruebas
crean especiales dificultades para los elaboradores y editores de pruebas, quienes afirman que es
esencial que puedan mantener en secreto los reactivos de las pruebas. Señalan que puede haber
una reserva limitada de reactivos para algunas pruebas y que es prohibitivo el costo en cuanto a
recursos económicos, materiales, humanos y de tiempo, el elaborar un conjunto nuevo de reacti-
,·os para cada administración sucesiva de la misma.
Algunas leyes ordenan la participación de la rama ejecutiva del gobierno en su aplicación.
Por ejemplo, el título VII de la Ley de Derechos Civiles de 1964 creó la Comisión de Igualdad de
Oportunidades de Empleo (Equal Employment Opportunity Commission; EEOC) para aplicar
la ley. La EEOC ha publicado series de lineamientos relativos a las normas que se deben cumplir
al construir y usar pruebas para seleccionar a sus empleados. En 1978, la EEOC, la Comisión
del Servicio Civil (Civil Service Commission), la Secretaría del Trabajo (Department of Labor) y
la Secretaría de Justicia (Department of Justice) publicaron en forma conjunta una guía de pro-
cedimientos para la selección titulada, Uniform Guidelines on Employee Selection Procedures. Una
muestra de uno de sus lineamientos es el siguiente:
El uso de cualquier prueba que afecte de manera adversa la contratación, promoción, transferen-
cia o cualquier otra oportunidad de empleo o de ingreso de las clases protegidas por el título VII
Ley de Responsabilidad y Portabilidad Proporcionado para los estándares privados que limitan la manera en que los proveedores de salud Yotros
de Seguro de Vida(1996 HIPM) puedan usar la información personal del paciente.
Ley de Educación para todos los Dicta laevaluación de niños con sospecha de capacidades físicas o mentales disminuidas. Una vez identi-
Niños Minusválidos (PL94-142) (1975 ficado, el individuo debe ser evaluado por un equipo profesional calificado para determinar cuáles son
y enmendada varias veces esas necesidades educativas especiales. El niño debe ser reevaluado en forma periódica. Enmendada en
óesóe entonces, incluyem\o IOEA de 19m) 1986 para amplia1 la protección ielacionada con \a disca11acidad en niños y bebés rncién nacidos o en
lasprimerasetapas de lainfancia.
Ley de laEducación para Individuos Ubicación inapropiada en programas de educación especial debido a diferencias culturales. Promueve el
con Discapacidades manejo de instrumentos y pruebas existentes así como otros medios alternativos de evaluación con el
(IDEA) Enmiendas en 1997 (PL 105-17) propósito de estimar el proceso de los estudiantes de nivel medio de educación especial através de las
evaluaciones del estado y el distrito.
Ley de No Dejar a los Niños Atrás (NCLB, por sus Conocida como la NCLB, la reautorización de la Ley de Educación Elemental y Secundaria de 2001 fue
siglas en inglés) de 2001 diseñada para ·cerrar los espacios de logro entre estudiantes minoritarios y no minoritarios y entr2
niños con desventajas ysin desventajas", entre otras cosas, al establecer normas estrictas de responsa-
bilidad en las escuelas así como la programación de evaluaciones periódicas para medir el progreso ele
íos distritos escolares y con ello mejorar el logro académico. La consigna de esta fegísfación fue: "¡La
demografía noes destino!'
Litigios
Hobson v. Hanson (1967) La Suprema Corte dictó que las pruebas de habilidad desarrolladas para blancos no podrían usarse para
calificar a estudiantes negros en el sistema escolar. Hacer eso podría resultar en la segregación de
escuelas no segregadas.
rarasofl v. Regentes de la Universidad los terapeutas (y evaluadores psicológicos) deben revelar información privilegiada si una tercera persona
de California (1974) está en peligro. En palabras de la Corte: "El privilegio de ser protegido termina donde comienza el
peligro público".
Larry P. v. Riles (1979 y reafirmada por El juez de California dictó que el uso de pruebas de inteligencia para colocar a los niños negros en cla-
el mismo juez en 1986) ses especiales tenía un impacto discriminatorio porque las pruebas estaban hechas bajo un 'prejuicio
cultural y racial".
Debra P. v. Turlington La corte federal dictó que la prueba de competencia mínima en Florida era inconstitucional porque perpe-
(1981) tuaba los efectos de la discriminación en el pasado.
Griggs v. Duke Power Company Empleados negros declararoncontra una compañía privada por prácticas de contratación discriminatorias.
(1971) La Suprema Corte encontró problemas con los 'instrumentos de pruebas generales" y dictó que las
pruebas deben 'medir de una manera justa, el conocimiento o las destrezas requeridas para un trabajo
particular".
Albemarle Paper Company v. Moody El psicólogo industrial de una compañía papelera encontró quelas puntuaciones en una prueba de habili-
(1976) dades generales predijomediciones de desempeño en el lrabajo. Sin embargo, como grupo, los blancos
tuvieron mejores puntuaciones que los negros en las pruebas. La Corte Distrital de Estados Unidos
encontró que el uso de la prueba era suficiente para el trabajo. Una corte deapelación no. Dictó que se
había llevado acabo una discriminación, aunque sin intención.
Regentes de la Universidad de California Cuando Alan Bakke supo que las puntuaciones desus exámenes eran más altas que algunos estudiantes
v. Bakke (1978) deminorías que habían sido admitidos en la escuela de medicina en Davis, la Universidad de California,
presentó una demanda. Una Suprema Corte altamente dividida acordó que Bakke debía ser admitido,
pero notuvo efecto en el uso de las consideraciones dediversidad en las decisiones de admisión.
A/len v. Distrito de Columbia (1993) Los negros tuvieron puntuaciones menores que los blancos en una prueba de promoción en un departa-
mento de bomberos, la cual estaba basada en aspectos específicos en la labor de apagar el fuego. La
corte estuvoafavor del departamento de bomberos ydictó que "el examen promociona!... fue una medida
válida delas habilidades y el posible éxito futuro de aquellos individuos que respondieron la prueba".
Adarand Constructors, tnc. v. Pena et al. Una empresa constructora que competía por un contratofederal declaró en contradel gobierno por perder
(1995) una oferta frente a un competidor controlado por una minoría, a la cual el gobierno había retenido en
el interés de una acción afirmativa. La Suprema Corte, en una decisión muy cerrada (5-4), estuvo a
favor del demandantey dictó que las políticas de la acción afirmativa del gobierno violaron lacláusula
de protección de igualdad de la 14a. enmienda. La Corte dictó: "El gobierno puede tratar a la gente de
manera diferentepor su raza, sólo por las razones más apremiantes·.
Jaffee v. Redmond {1996) Lacomunicación entre el psicoterapeuta y el paciente (y demanera presumible, un evaluador psicológico
y un cliente) es privilegiada en las cortes federales.
Grutter v. Bollinger (2003) En una decisión altamente dividida, la Suprema Corte aprobó el uso de la raza en decisiones para admi-
siones educativas en una base de tiempo \imitado alavor de beneticioseducativos que fluyen desde un
cuerpo estudiantil diverso (véasesección Close-up).
constituye una forma de discriminación a menos que: a) la prueba haya sido validada y muestre
e\idencias de un alto grado de utilidad como se describe más adelante y b) la persona que aplica
o actúa en base a los resultados individuales de la prueba puede demostrar que no se dispone de
otro tipo de procedimientos de contratación, transferencia o promoción adecuados y/ o alternativos
para... su uso.
:-(ótese que en este extracto coexiste una defuúción de discriminación como excluyente con el
"isto de que, una prueba válida que evidencia "un alto grado de utilidad" (entre otros criterios)
será considerada como discriminatoria. Sin embargo, por lo general, el público rápidamente ha
~ t..1etado una prueba como injusta y discriminatoria sin importar su utilidad. Como consecuencia,
_,ora coexisten una gran demanda pública de proporcionalidad y equiparabilidad en la con trata-
~ entre los miembros de un grupo y su admisión a universidades, con una alta escasez de propor-
oonalidad en cuanto a las habilidades manejadas por los miembros del mismo. Gottfredson (2000)
5a:ialó que mientras que las normas de selección a menudo podían mejorar, la manipulación de esas
=mmas "sólo produciría frustración, no soluciones permanentes". Recomendó que las soluciones
::ermanentes fueran buscadas refiriéndose al problema de las diferencias entre las deficiencias de
.::.iliilidades en los grupos. Sugirió no tratar el problema reduciendo las contrataciones y las normas
~ admisión o mediante una legislación diseñada para hacer de la contratación y la admisión cues-
:JOnes de características específicas para cada grupo en particular. Es en la última dirección a donde
x está yendo esta cuestión, al menos según la última legislación y las decisiones de la corte.
En Texas, la ley del estado ahora dicta que los alumnos que se encuentren en 10% superior a
;ocios los alumnos de todas las preparatorias de Texas sean admitidos en la Universidad estatal,
~, tomar en cuenta las puntuaciones SAT. Esto significa que sin importar la calidad d e la educa-
óón en cualquier preparatoria particular de Texas, a cualquier graduado que se encuentre entre
: :J"o de los mejores alumnos, se le garantiza la admisión a la universidad sin importar qué pun-
::..iación haya obtenido en una medición estandarizada a nivel nacional. Se han escrito informes
de que en algunas preparatorias de Texas, 25% de los estudiantes pertenecen a un rango que los
3-itúa en el 10% más alto de su grupo (Kronholz, 1998). En California, el uso de las pruebas de ha-
:iilidad en el sector público ha disminuido como resultado de la aprobación de la Proposición 209,
la cual prohibió las preferencias raciales (Rosen, 1998). Una consecuencia ha sido la disminución
del énfasis de la Prueba de admision es para la escuela de leyes (the Law Admissions Test, LSAT)
como un criterio de admisión a la carrera de leyes en Berkeley, California. Además, la escuela de
leyes ha dejado de tomar en cuenta los promedios generales de las escuelas dentro de sus crite-
:ios de admisión, de modo que "4.0 del estado de California tendría el mismo valor que 4.0 de un
estudiante en Harvard" (Rosen, 1998, p. 62).
Gottfredson (2000) argumentó que aquellos que estaban a favor de regresar a las normas de
!ogro obtendrían "ningún valor duradero al eliminar las pruebas válidas". Para ella, disminuir
!as normas equivale a dificultar el proceso " mientras sólo se tiene la ilusión del progreso". En vez
de regresar a las normas de logro, la sociedad se beneficia más al realizar acciones para cambiar
tendencias desafortunadas en la estructura familiar. Frente a desventajas consistentes entre los
miembros de varios grupos, Gottfredson enfatizó la necesidad d e capacitación en habilidades, no
en el hecho de bajar los estándares de logro o en un ataque infundado hacia las pruebas.
Las legislaturas estatales y federales, los cuerpos ejecutivos y los juzgados han estado intere-
sados en muchos aspectos de las pruebas y la evaluación. Ha existido poco consenso acerca d e si
las pruebas validadas en las que existen diferencias raciales pueden ser utilizadas para apoyar las
decisiones relacionadas con el empleo. Los juzgados también han estado aferrados con el papel
de la diversidad en los criterios para la admisión a universidades y escuelas profesionales (véase
Close- Up). Por supuesto, el público no tiene un monopolio en el impacto y manejo de aspectos
relacionados con las pruebas y la evaluación.
Evaluación, admisiones
y acción afirmativa;
Grutter contra Bollinger et al. (2,003)
Barbara Grutter, residente de raza blanca en Michigan, tlizo uha dé Leyes (LSAT), el entusiasmo con el que los solicitantes
solicitud a la Escueta de Leyes en la Universidad de Mich19an escriben cartas para apoyar su solinitud, y un ensayo en donde
(UML) en 1996. Tenía un promedio de 3.8, entre otros requisi~ puntualizan cómo cont:ribuirán ellos mismos ala vida y la di-
tos. En respuesta a su soli<;:itud, la UML Je notificó que estaba versidad de la escuela de •leyes. Aunque se espera que ningún
en una lista de espera. Sin embargo, cuando más tarde se le solicitante tenga problemas académicos, un arto promedio de
negó la admisión,.entabló una demanda jl.ldicial en contra de calificaciones y la p1,1F1tuación tile ta prueba son insuficientes
Lee Bomnger (el dectmo de la escuela de leyes) y otros, en para asegurar la admisión. tas políticas de la escuela dictan
donde alegó que la UMl la había discriminado por su raza. En que deben tomarse en cuenta otros criterios, como tas r:rmtri-
1a demanda se alegó que la UML había dado a los solicitantes buciones que podría hactJr el solicitante a ltJ Vida sooJ;1.J e inte-
Qt,Je pertenecían a ciertos grupos minoritarios una oportunidad lectual de la ífl$titución, incluida una evaluación en la d.ecisión
significativamente mayor de admisi6n que a estudiantes con de la admisión.
credenc;alés similares (Je grupos raciales desfavorecidos.* El Las políticas de la UML pretendían aceptar a una oonc11-
tribunal estuvo a favor de lá demandante, Grutter. un tribunal rrencia signifícatii/a de una minoría no representativa de estu-
de apelación cambió él juicio, y estuvo a favor ,del demandado, diantes. "Concurrencia significativa" no se refería a un número
UML Se llevó a cabo una apelación eón la Suprema Corte para o porcentaje particular de estudiantes, sino a un núnléro tal
escuchar y decidir el caso. de estudiantes, en ei que los que pertenecían a minorías no se
La última vez que la Suprema Corte tuvo una cuestión sintieran aislados o como portavoces de su raza. Un testigo de
similar fue hace m~s de veinticine() .años, en el caso de los re~ la UMl testificó que cuando existe una conc11rre1Jr;ia significa-
gentes de fa Universtdá<i ae Calitómia contra 8akké, ~n Bakke, tiva de estudiantes que pertenecen a minorías, los estereotipos
una Supréma Corte dividida de manera tajante dictó que un raciales pierden tuetza porgué los estudiantes a1:1e no perte-
[-$1.ádo tiene un interés sustancial que debe ser servida <Je necen a mi(lórías aprenden que no hay dun punta de vista ,de
manera legítima pór uJJ {)ró{Jtama, .<Je admisiones aplícado de la minoría", sino que existe una v,1tiedad de puntos dé vista
una manera propifl que implic;1ra la consideración competitiva dentro de las minorías. Otro testimonio sugirió que la admisión
de rrJza y origen étnic{). Un ''programa,de adrhisiones apli<;:ado de la UML tenía el efecto r,te hacer QUe los debates de clase
de una man!'ira propia" e~a uno que, en parte,.permitiera una fueran más vívidos, con más espíritu y1 más bri nantes porque
evaluación en verc;lad individualizada de los solicitantes, mieh- los estudiantes pertenecían a una variedad dé contextos di-
trru¡ se emplearan criterios raciales de forma flexible y no me- ferentes. Compañías como 3M y General Motors solicitaban
canioa. Es más1,el;juez Powell, aJ escribir la opinión en Bakke, gente egresada de la UML, pórque, según argurnelltaban, las
había advertido: La garantía de una protección igualitaria no habilidades que se requieren en el mercado global de ttoy se
puede significar una cosa cuando se aplica a un individuo y adquieren de la exposición a diversa gente y c.ulturas.
otra c;uando se ap/ic;a a una persona de otro c;o.Jor; Sí a ambos Los testigos de la UML nunca consideraron lo que signifi-
no se les oftéce la miSmfi protet:c.íón, entonces no es igualdad caba ''concurrencia significativa" al aceptar a estudiantes que
(Bakke, 438 u. s., en 289), pertenecían a minorías. i!stos testigos negaron que ellos man-
La Suprema Gorte acordó esóuChar a Grutter, Antes dé tuvieran lo que, de alguna forma1 podría caracterizarse como
presentar la decisión, aquí se exponen algunos datos basados un sistema de cuotas. En este contexto, el si~ema de cuotas
en la evidencia presentada. La UML recibe 3 500 solicitudes, puede definirse Cli!Jt!O un procedimiento de selección en e.l que
en donde $610 habtá 350 lugares,Al igual que otras ínstítuélo- un número fijo o porcentaje de aspírames que pertenecían a
nes de nivel superior, la UML ha desarrollado procedimientos ciertos contextos debían sér seleccionados. La UML, sin em-
de evaluación para determinar quiénes, entre todos los soli- bargo, admitió haber monitoreacto reportes diarios que seguían
citantes, serán aceptados y quiéne.$ no. !Ji: untversidad utitiia la pista de la c:omposición racial y étnica de la clase.
varios criterios para la evaluación, como promedios<le califi- Haciendo eco de las opiniones drvidic;las y la falta de con-
caciones, puntuaciórt én la prueba de adtnisióo para la Escuela senso general visto en Bakke, la Suprema Corte estuvoª favor
de la UML. Los ctísidentes Sé preguntaron si el 'Estado tenía un
interés pór proteger la diversidad y si las políticas de la UML
• El texto en itálicas repr~enta la tránS<:tipción textual de l~ opirri\')¡;¡ ~ ta
reflejaban un intento ,por lograr uri balance racial. Uno de los
para la Suprema C¡irle por el ju~z Q'Connot i:on fedl;¡ ~ de j!JtÜO, :Í003. disidentes hizo refetencia a la consulta de reportes oiari~s de
2 UML con r,ef.'!lirentía a 1a ºooncurrencia significativa\ y escribió justq, y compefitiv~, y na hJJ.bierfJ tenida las .bases Pi!lfl quejarse de
~ durante las etap~ ti.o:at~ del proceso <te admisión, l/0 hubo un tmto r,fe.$igual en la enmienda catorce, (4;38 u, S,, ¡¡tql. ;318)
..!1 intento por (}na explora.ción Jf/dividuat, exceptó f)ót la rata
-:isma. Esta justicia de oisentirniento más adelante espeouló que La Corte advirtió que los programas de admisión basados
2 raza quizá era el factor determinante para muchos miembros en ta raza, cteoen te.ner limitacltmes de tiempo, El hecliO de en~
:e grupos miñor,~rlos Quienes na ~IWJ (:fentrq del rango supe, glo/;Jar una justifi(;actón permammte para las preferencias r;iciª-
:rx de tas puntuaciones y grádos del I..SAT. · le$ 't)fénderla et prinaipfá fftñd;imerrmt (le la fJt(Jtécción igualitariá.
Aún así, la corte estableció, Hoy, sostenemos q1Je /í:f Escuela El requisito del límite de tiempo podría óum11Urse a través de
~ Leyes tiene un interés convtnaente en obtener un o.uerpo medida$ ''li;irnporales•i (Jinearnientos que indiquen cuáadó $.e
sSllldiantil diveri(). La Corte aceptó los argumentos de la UML, dará por l':loncluido) o pot revisiones periódicas par¡:1 dE!letrninar
:::duyendo er argumento de que no s.eutilizab:a un sistema oe si aún son neces;jfftJ.$ las preferencias raciales para aons1?91Jír fa
::mtas. La Q'Qtte notó que entre 199a y2000 el número de es- dfversidad en el cüef{Jo ~tudíat'í'tll. Al citar decisiones anteriores
::mantes afroamerícancis, latincis y amencanos nativos en c.ada y artículos de revisión de la ley, la Corte observó que
:me variaba de 13,5% a 20.1%; un rango que la Corte encontró Sería un dfa tristecuando Estados llnidos se convierta en una socie-
;:ronsistente con una cuota, La Corte rechazó el argumento dé
dad sostenida porct1ows, y~ ~dá minódá identlffcable se te asigne
3rutter de que los medios raoiales~ne«tfales eXistían para crear
/Jf1a represettl:áci611 PtófJt)tCiotUJl l);)[a cada paSQque desee daten la
:2 diversidad,buscada por la IJML La Corte reconoció, como tam-
vida. Pero eso nq ~ racjonfJI par.a/os programas de trato preteren•
.:::éfl lo hizo en 8ákke, que existen problemas swios de justicia
cía!. La prueba áeida de StJ ÍíJ.$tffíC}Jción será laeficilCia patá eliminar
'JOl1ectado$ can /aldea de preferencia misma, Aún así, al igual
de tajo la necesidad de preferencias etnicas o raciales,
:ue en Bakke, la mayoría concluyó qye mientras un programa de
31misione~ ~onsciente en la ra¡a lltilice a ésta como un factor En resumen1 lá Supremá Corte dictó en el caso Gtutter que
3ficional en él contexto de una O()nSideración individualizada, un la cláusula de ,protecoión a ,la igualdad no pro/JllJe el uso de ra-
35pirante rechazado zas, f1.f},aptad4 d~ @a(l.era estr!lcha CY con límite o.e tiempo] en las
••;
no ha agotado tod(I$ SU$ PO$ibíli(!ades de tener un /ll!Jaf tan sólo decislones c011cemiet1tes aaQúéllas encamíñatlas a promover un
porque tenía el color equivocado o porque tenía et apellido lncorr~1¡,~ fatf!fé.s por <1btener f()s beñé.fi.CiflS ,educativos que fluyan desde
to.., Sus tualída(f~p.udferon ft;¡l)er sida sopesadíJs de [Jna manera un cuerpo es,tudiantil div,erso.
Caracteñsticas del usuario de pruebas ¿Debe permitirse a cualquiera que compre y use materiales
de pruebas psicológicas? Si no, ¿a quién se le permitiría usar pruebas psicológicas? Ya desde 1950,
el Comité sobre Normas Éticas para la Psicología (Committee on Ethical Standards for Psycholo-
gy) de la APA publicó un reporte llamado Ethical Standards for the Distribution ofPsychological Tests
and Diagnostic Aids. Este reporte definió tres niveles de p ruebas en función del grado en el que su
uso y aplicación, requiere conocimiento de las técnicas de aplicación específicas para cada una,
así como de materias relacionadas con la psicología:
Nivel A: Pruebas o auxiliares que pueden administrarse, calificarse e interpretarse de manera ade-
cuada con la ayuda del manual y una orientación general de la clase de institución u organización
en la que el administrador está trabajando (por ejemplo, pruebas de logro o destreza).
Nivel B: Pruebas o auxiliares que requieren algún conocimiento técnico en la elaboración y uso de
pruebas, de campos de apoyo como estadística dentro de contextos psicológicos y educativos, di-
ferencias individuales, psicología de la adaptación, psicología de lo laboral y en orientación (por
ejemplo, pruebas de aptitudes, inventarios de adaptación aplicables a poblaciones normales).
Nivel C: Pruebas y auxiliares que requieren una comprensión considerable de las técnicas de apli-
cación de las pruebas y campos psicológicos de apoyo, junto con experiencia supervisada en el
uso de estos dispositivos (por ejemplo, pruebas proyectivas, pruebas mentales individuales).
El reporte incluía descripciones de los niveles generales de capacitación correspondientes a cada
uno de los tres niveles de pruebas. Aunque algunos editores continúan usando esta clasifica-
ción de tres niveles, otros ya no. En general, las normas profesionales promulgadas por la APA
(ABRA, 1999), NASP (2000; Jacob-Timm & Hartshome, 1998) y otras organizaciones profesiona-
les establecen que las pruebas psicológicas deben ser usadas sólo por personas calificadas. Ade-
más, existe un mandato ético para tomar las medidas pertinentes con el fin de prevenir el mal
uso de pruebas y la información que proporcionan. Las obligaciones que tienen los profesionales
respecto a los evaluados se establecen en un documento llamado Código de Prácticas de Pruebas
Justas en la Educación (Code of Fair Testing Practices in Education). En conjunto con autores y/o
3. Por desgracia, a pesar de que las organizaciones en muchos otros países han expresado de manera verbal su preocupa-
ción sobre la ética y los estándares en la aplicación de pruebas y su evaluación, son relativamente pocas las organizaciones
fuera de Estados Unidos las que en realidad han llevado a cabo acciones significativas y eficaces (Gregoire, 1999).
-!. Para má-; información sobre el ABAP, escriba a esta organización en 1000 Brickell Avenue, Suite 910, Miami, Florida
33131.
(continúa)
logrado promulgár en gran medida, códigos de ética que requieren la Los psicólogos y psiquiatras a los que se les llama para háéi!r
previsión de,l.syicidío. la promulgación de fa ley en Oregon ha puesto evaluaciones para conoc.er qué tan competente es la decisión con
a los trabajadores clínicos de ese estad.o en una posición única, si no respecto a la muerte con dignidad .pueden aceptar o negar é!Jcha
e.s que difícil,; Por años, much:úS de estos prófesionales clínicos han responsabilidad (Haley y Lee, 1998}. Ajuzgar por um-1 encuesta de 423
dedicado sus esfuerzos a la prevencwn del suicidio. Frecµeotemente, psicólogos en práctica clínica en Oregon (Ferm & Ganzini, 1999) mu-
han sido designados para ser parte activa, si rió !!S que r.icilitadore$ chos de ellos a quienes se les pedía hacer esas evaluaoii'.ines de vida
de suicidio-asistido por un médico; independientemente de cómo se o muerte se negaron a hacerlo. Un tercio de la muestra respondió que
designe legislativamente al proceso de áY!Jda para morir. Nótese que la una evaluación de la ODDA estaría fuera del margen de su práctica.
ley de Oregon niega de manera escrupulosa que su objetivo sea Otro 53% de la muestra dijo que se negaría a desempeñar la evalua-
la legalización del suicidio asistido por un médico. De hecho, el lengua- ción y no realizarían ninguna acción o se negarían a realizar la evalua-
je del artículo manda que cualquier acción tomada bajo él "no debe, ción por ellos mismos, por tanto, referirían1a.l pacieote con un colega.
por ningún motivo, constituir ningún tipó ~e suicidio, suicidio asistido, Aunque ya tienen que establecerse lineamientos firmes irespecto
asesinato u homicidio por piedad, bá¡ó la ley". Los marcos de la legis- a lo que la evaluación de la ODDA va a contener, FarrenkOp,t y Bryan
lación lo percibieron como un medio •(JO{ el cual un individuo con una (1999) ofrecieron vari¡¡s y útiles sugerencias (que se resumen en la
enfermedad terminal podría ejercar algún control sobre el proceso de tabla siguiente).
muerte. l;Xpresado en éstos términos, el sobño deber del médico en el
proceso debe hacerse más aceptable, si es que no más ennoblecido.
B derecho a dar consentimiento informado Las personas que responden las pruebas tienen el dere-
cho a saber por qué se les están aplicando, cómo se usarán los datos de la prueba y qué informa-
.::::ón, si es que hay alguna, será revelada y a quién. Con amplio conocimiento de esa información,
:.OS que responden las pruebas dan su consentimiento informado a ser evaluados. La revelación
de esta información debe estar, por supuesto, en un lenguaje que el individuo que responde la
?rueba pueda entender. Por tanto, para una persona de dos o tres años de edad o un individuo
ron deficiencia mental con una capacidad lingüística limitada, una información dada antes de la
FTIIeba se expresaría como sigue: "Voy a pedirte que trates de hacer algunas cosas para que pueda
• c'f lo que sabes hacer y para qué cosas podrías necesitar algo más de ayuda" (APA, 1985, p. 85).
Si la persona que va a responder una prueba es incapaz de proporcionar un consentimiento
=tformado, dicho consentimiento puede obtenerse por medio de alguno de los padres, tutor o re-
~resentante legal. El consentimiento debe ser por escrito en lugar de oral y éste debe especificar:
: el propósito general de la prueba; 2) la razón específica que se persigue en el presente caso y 3)
el tipo general de instrumentos que se administrarán. Muchos distritos escolares envían ahora de
::ianera rutinaria a los hogares dichas formas antes de examinar a los niños. Tales formas incluyen
de manera típica la opción de hacer que el niño sea evaluado en forma privada si el padre así lo
:iesea. En casos donde las pruebas son ordenadas en forma legal (como en una situación determi-
:ia.da por el tribunal o juzgado), la obtención del consentimiento informado para la prueba puede
.:onsiderarse más una cortesía (realizado en parte por razones de establecimiento de una buena
a:npatía) que una necesidad.
Un área gris con respecto al derecho del consentimiento informado de forma completa para
.:p.i.ien responde la prueba, implica proveer por parte del evaluador, de información basada en
!:..·w estigaciones y situaciones experimentales donde la revelación de los hechos pertinentes a la
:7rueba (incluyendo la hipótesis del experimentador y cosas por el estilo) lo que podría contami-
:iar en forma irrevocable los datos de la prueba y los resultados obtenidos a través de la misma.
En algunos casos excepcionales, se maneja cierto grado de decepción para generar situaciones
específicas. Por ejemplo, puede crearse una decepción para evaluar cómo reaccionaría un trabaja-
.::or de emergencias bajo esas condiciones. A veces la decepción incluye el uso de cómplices para
5lmular condiciones sociales que son comunes o poco comunes en una situación particular.
En situaciones en las que es aconsejable no obtener un consentimiento informado para la eva-
:::Z.,ción, se ordena la discreción profesional. A los que resuelven la prueba se les debe dar una
..antidad de información núnima antes de comenzar. Por ejemplo: "Esta prueba se va a llevar a cabo
:orno parte de un experimento sobre la obediencia a la autoridad". Después de la prueba se debe
~ una explicación amplia y completa. Varias organizaciones profesionales han creado políticas
:, lineamientos respecto a la decepción en la investigación. Por ejemplo, los Principios éticos de los
~-:cólogos y el código de conducta (Ethical Principles ofPsychologi.sts and Code of Conduct, 2002) de la APA
?JOrnueven que los psicólogos a) no utilicen la decepción a menos que sea absolutamente necesario,
El derecho a ser infonnado de los hallazgos de la prueba En épocas pasadas, la inclinación de mu-
chos evaluadores psicológicos, en particular de muchos clínicos, era informar lo menos posible a
quienes respondían una prueba sobre la naturaleza de su desempeño en una prueba en particular
o en el conjunto de pruebas aplicadas. En ningún caso revelaban conclusiones diagnósticas que
pudieran causar ansiedad o precipitar una crisis. Esta orientación se reflejaba al menos en un tex-
to autorizado donde se les aconsejaba a los examinadores que mantuvieran la información sobre
los resultados de la prueba en un nivel superficial y se centraran sólo en los hallazgos "positi-
vos" . Esto se hacía para que el examinando dejara la sesión de prueba sintiéndose "complacido
y satisfecho" (.Klopfer et al., 1954, p. 15). Pero to<lu esto ha cambiado, y dar información realista
sobre el desempeño en la prueba a los examinados no sólo es obligatorio desde el punto de vista
ético y legal, sino que también puede ser útil desde una perspectiva terapéutica. Las personas que
responden pruebas tienen el derecho a ser informadas, en un lenguaje que puedan comprender,
de la naturaleza de los hallazgos con respecto a los resultados obtenidos. También tienen derecho
a saber qué recomendaciones se hacen como consecuencia de los datos de ésta. Si los resulta-
dos, hallazgos o recomendaciones hechos con base en los datos de la prueba son inválidos por
cualquier razón (como irregularidades en la administración de la prueba), quienes respondieron
tienen derecho a saber esto también.
Debido a la posibilidad de consecuencias adversas como resultado de proporcionar a los
individuos información sobre ellos mismos - como su capacidad, su falta de capacidad, super-
sonalidad, sus valores- la comunicación de los resultados de una prueba psicológica es una de
las partes más importantes del proceso de evaluación. Con una sensibilización adecuada para
cada situación, el administrador de la prueba informará a quien la respondió (y al padre, tutor
o representante legal) el propósito de la prueba, el significado de la puntuación con relación a la
de otros que la han respondido y las posibles limitaciones y márgenes de error. Y, sin importar
si este informe se hace en persona o por escrito, deberá estar disponible un psicólogo calificado
para responder cualquier pregunta que tenga quien respondió la prueba (o sus padres) acerca de
las calificaciones, puntuaciones o resultados. De manera ideal, debería estar disponible el recurso
de orientación para quienes reaccionaron de una manera adversa al enterarse de la información
presentada.
Autoevaluación
Pruebe su entendimiento de los elementos de este capítulo, viendo si es capaz de explicar cada
uno de los siguientes términos, expresiones, abreviaciones, sucesos o nombres en términos de su
significado en el contexto de pruebas y evaluación psicológicas:
5. Véase !versan vs. Frandsen, 237 F. 2d 898 (Idaho, 1956) o Cohen (1979, pp. 149-150).
6. Un aspecto interesante aunque tangencial de este caso fue el argumento expuesto por Iverson de que "ella había llevado
a su hija a consulta por claustrofobia y que, dado este hecho, la administración de una prueba de inteligencia no estaba
autorizada y se encontraba fuera del alcance de la consulta". Sin embargo, el demandado probó a satisfacción del tribu-
nal que la admini,;tración de la Stanford-Binet era necesaria para determinar si Jo Ann tenía la capacidad mental para
responder a la psicoterapia.
Un vistazo a la red
Revise los siguientes sitios web para más información sobre temas de este capítulo: