Antecedentes (Anastasi)
Antecedentes (Anastasi)
Antecedentes (Anastasi)
'
Se encuentra una descripci6n mAs detallada d i Icn orgenes de las pniebas psicol6gicas e n E L. Gouiienough
(1949) y en J. Peterxm (1926). Vease tambin b r i n g (1950) y G. Murphy y Kovach (1972) para antecedentes
ms generales, DuBois (1970) y McReynolds (1975. 1986) para recuentos ms recientes de la hiscoria de las
pniebas psicol6gicas, y Anastasi (1965) para los antecedentes hist6ricos del estudio de las diferencias individiiales. En Acascasi (1993) hzv un repaso
de las cendericias actuales de la psicometra.
INTERS INICIAL EN LA C L A S I F I C A C I ~ N
Y L A CAPACITACIN
DE LAS PERSONAS
CON RETARDO M E N T A L
El siglo XIX atestigu el surgimiento del inters por el tratamiento humano de las
personas
"insanas" y las que sufran de retardo mental. Hasta ese momento, el desti.-.
.--- - -
lbas
ac5 Y
.>rey el
astetru ers
da)
elalino
1 de
ir el
n 1;
mes
. los
ough
entes
le las
idua-
Tablero de Formas* de Seguin (Seguin Form Board), en el que el individuo debe insertar bloques de distinta apariencia en los huecos correspondientes tan rpidamente
[como pueda3
Ms de medio siglo despues del trabajo de Esquirol y Seguin, el psiclogo francs
Alfred Binet recomendaba que los nios que no lograran responder a la educacin
normal herzn evaluados antes de expulsalos y que, de ser considerados educables,
fueran asignados a cursos de educacin especial (T. H. Wolf, 1973). Con sus compaeros de la Sociedad Fara el Estudio Psicolgico del Nio, Binet exhort al ministro
de Instruccin Pblica a emprender acciones para mejorar las condiciones de los nios retardados. Un resultado especial fue el establecimiento de una comisin ministerial a cargo de Binet para el estudio de estos infantes. Tal designacin fue un
acontecimiento trascendental en la historia de las pruebas psicolcgicas.
:I
i!
h! i l
!
En general, los primeros psiclogos experimentales del siglo xIX no estaban interesados en la medicin de las diferencias individuales. Su objetivo
la formulacin de descripciones generalizadas de la conducta humana, lo que supone que su
atencin se concentraba en las uniformidades ms que en las diferencias conductuales, y que, por lo tanto, las diferencias individuales eran ignoradas o aceptadas como
un mal necesario que limitaba la aplicabilidad de las generali&iones. As, el hecho
de que un' individuo reaccionara de manera diferente a otro en las mismas condiciones era considerado como un error, o variabilidad individual, que disminua la exactitud de las generalizaciones. sta era la actitud hacia las diferncias individuales que
prevaleca en laboratorios como el fundado por Wundt en Leipzig en 1879, donde se
formaron muchos de los primeros psiclogos experimentales.
Al elegir sus reas de estudio, como en muchas otras fases de su trabajo, los fundadores de la psicologa experimental evidenciaban la influencia de sus antecedentes en
la fisiologa y la fsica. Los problemas que estudiaban en sus laboratorios tenan que
ver principalmente con el tiempo de reaccin y con la sensibilidad a estmulos sensoriales como los visuales y los auditivos. Como veremos en otros captulos, este acento
en los fenmenos sensoriales refleja tambin la naturaleza de las primeras pruebas psicolgicas.
Otra influencia que la psicologa experimental del siglo XIX ejerci en el curso del
movimiento psicomtrico se manifiesta en sutnsistencia por ejercer un control riguroso de-lascondiciones en las que se realizan las observacionej; por ejemplo, la forma de
dar las instrucciones en un experimento de tiempo de reaccin puede aumentar o disminuir de modo notable la velocidad de la respuesta, y el brillo o el color del fondo
pueden alterar marcadamente la apariencia de un estmulo visual, lo que demuestra la
importancia de que todos los participantes del experimento sean observados en condiciones estandarizadas. Esta estandarizacin del procedimiento lleg a convertirse en
una de las seales distintivas de las pruebas psicolgicas.
*Tarnbi&nconocido corno T&ho de encajamienros. (N. del T.)
ie in- ;
lente
mces
acin
&les,
mpaiistro
>S ninisteie un
eresa>mu:ue su
ictuacomo
iecho
ficioiacti-S que
d e se
imdat e -en
n que
iensocento
as psiso del
, iguroma de
o dis;: fondo
i m a la
:zondirse en
,35
C O N T R I B U C I O N E S D E F R A N C I S GALTON
El bilogo ingls ~ r a n c i s e a l t o n e~ el ~ s p o n s a b l del
e inicio del movimiento psicommco. Un factor comn en las numerosas y variadas actividades de investigacin de Galton fue su inters por la herencia humana. En el curso de sus
investigaciones sobre esta materia, Galtor, se dio cuenta de Ir necesidad de medir las
caractersticas de personas que estaban y no emparentadas, ya que slo de esta manera
poda descubrir, por ejemplo, el grado exacto de parecido entre padres e hijoslhermanos y hermanas, primos o gemelos. Con este propsito, Galton convenci a diversas
instituciones educativas de que llevaran registros antropointricos sistemticos de sus
estudiantes. Tambin estableci un laboratorio antropomtrico en la Exposicin Internacional de 1884 donde, mediante el pago de tres peniques, se medan ciertos rasgos fsicos de los visitantes y se los someta a pruebas de agudeza visual y auditiva, fuerza
muscular, tiempo de reaccin y otras funciones sensoriomotors simples. Cuando la
exposicin cerr, Galton transfiri el laboratorio al Museo de South Kensington, en
Londres, donde trabaj durante seis aos. Con estos mtodos se acumul gradualmente el primer cuerpo sistemtico de datos sobre diferencias indi~~iduales
en los procesos
psicolgicos simples.
El propio Galton elabor varias de las pruebas aplicadas en su laboratorio, muchas
de las cuales siguen siendo conocidas, sea en su forma original o modificada. Entre los
ejemplos se encuentran la barra de Galton para la discriminacin visual de la longitud, el silbato que lleva tambin su nombre para determinar el mayor tono audible y
una serie graduada de pesos para medir la discriminacin cinestsica. Galton crez que
las pruebas de discriminacin sensorial podan servir para estimar el intelecto. A este
respecto, haba sido tambin la influencia de las teoras de Locke. As, Galton escribi: "La nica informacin concerniente a los acontecimientos externos que nos alcama parece pasar por la avenida de los sentidos, y entre ms perceptivos sean los
sentidos de Ias diferencias, mayor ser el campo sobre el que pueden actuar nuestro
juicio y nuestra inteligencia" (Galton, 1883, p. 27). Galton tambin se percat de que
las personas con retardo mental extremo tienden a mostrar defectos en su capacidad
para discriminar entre calor, fro y dolor, una observacin que posteriormente fortaleci su conviccin de que la capacidad de discriminacin sensorial, "en conjunto, sera
ms elevada entre los intelectualmente aptos" (Galton, 1883, p. 29).
Galton tambin fue pionero en la aplicacin de escalas de calificacin y cuestionarios, as como en el usa de la tcnica de asociacin libre que posteriormente fue utili.zada con diversos propsitos. Otra de sus muchas contribuciones se encuentra en la
formulacin de mtodos estadsticos para el anlisis de datos sobre las diferencias individuales. Galton tom y adapt algunas tcnicas matemticas de forma que pudieran
ser utilizadas por investigadores sin conocimientos en la nateria que desear- tratar
en forma cuzntitativa los resultados de sus pruebas. De esta manera extendi considerablemente la aplicaci6n de los proce'dimientos estadsticos al an!isis de datos de !as
pruebas. Esta fase del trabajo de Galton fue llevada adelante por muchos de sus estudiantes, de los cuales Karl Pearson2 fue el ms eminente.
Para una descripcian fascinanre de los primeros avances de los principales conceptos esradsricos y de las penonas responsables, vase Cowles (1989).
36
ente
estaento
:mpo
brid.divim el
novigica
le catelecfuerza
litiva,
; elecdidad
tos de
mr di.ir con
:dicio,alcanSSen
la
tos. En
,t una
;os permas
1s prueostraba
) l ) y su
S califi? 1% ca-
(J.
a cubrir
todo en
ebas paluo. Las
3an desfatiga y
pruebas
le era la
.empeo
37
38
inteligencia;3 sin embargo, el propio Binet evitaba el uso del termino por sus implicaciones no verificadas de desarrollo y prefera el ms neutral de "nivelomental" (T.
H. Wolf, 1973).
En 1911, ao en que Binet muri intempestivamente, aparecij la tercera revisin
de la &cala de Binet-Simon, que no presenta mayore modificaciones, salvo revisiones menores, cambios en la localizacin de algunos tests, la adicin de otros en varios
niveles de edad y la extensin de la escala al nivel adulto.
Incluso antes de la revisin de 1908, los tests de Binct-Simon atrajeron la atencin
de los psiclogos de todo el mundo. En muchos pases, aparecieron traducciones y
adaptaciones, pero la primera fue la de H. H. Goddard, en ese entonces psiclogo investigador en la Escuela de capacitacin de Vineland para nios con retardo mental.
La revisin de Goddard result clave para que la profesin m ca aceptara los tests
de inteligencia (Zenderland, 1987). Apareci en un momento propicio para satisfacer
la urgente necesidad de un instrumento estandarizado para diagnosticar y clasificar a
las personas con retardo mental. No obstante, como herramienta de evaluacin pronto h e dejada atrs por el Stanford-Binet, un instrumento ms extenso y psicomtricamente refinado, elaborado por L. M. Teman y sus colaboradores en la Universidad de
Stanford (Teman, 1916). Este instrumento utiliz por primera vez el cociente de inteligencia (CI) o razbn entre la edad mental y la cronolgica. ia ltima revisin se
emplea extensamente y la estudiaremos de manera ms completa en el captulo 8.
Tambin resulta de especial interbs la primera revisin Kuhlmann-Binet, que ampii6
la escala hasta la edad de tres meses (Kuhlmann, 1912) y representa uno de los primeros esfuerzos por elaborar tests de inteligencia para preescolares e infantes.
PRUEBAS COLECTIVAS
h s tests de Binet, as como todas sus revisiones, son escalar individuaks en el sentido
de que s61o pueden aplicarse a una persona y luego a otra. Muchos de los tests de esas
escalas requieren respuestas orales del examinado o la inanipulacin de materiales.
Algunos exigen tomar el tiempo de las respuestas de cada individuo. Por stas y otras
razones, las pruebas no pueden adaptarse a la aplicacin colectiva. Otra caracterstica de los tests de Binet es que requieren de un examinador muy capacitado, pues se
trata de instrumentos esencialmente clnicos adecuados para el estudio intensivo de
casos individuales.
L a i *bus
de grupo similares a la primera escala de Binet fueron elaboradas para
satisfacer una necesidad prctica. Cuando los Estados Unidos ingresaron en 1917 en
la Primera Guerra Mundial, la Asociacin Estadounidense de Psicologa form una
comisin para considerar cmo poda contribuir la psicologa a la conduccin de la
'
F. L. G d e n o u g h (1949. pp. 50-51) observque en 1887.21 aos antes de la aparicin de ia Escala Binet-SIrnon de 1908. S. E. Chaille public en el New Orkans M e d i d and Surgical Jounuil una serie~dcpruehas para infantes, arregladas de acuerdo con la edad en que solan ser pasadas. Debido en pane a la limitada circulaci6n de
la revista y quiz tambin a que la comunidad cientifica no estaba preparada. en esa e p c a pas inadvertido el
significado del concepto de escala de edad. La propia escala de Biner recibi la influencia del trabajo de algunos
de sus conremprAnevs. principalmente Blin y Damaye. que prepararon un conjunto de pregunta: orales de las
que ohreiian uiia sola calificaci61iglobal para cad.1 nio (T. H. Wnlf. 1973).
..
;Antecedentes histricos de las pruebas actuales
npli!" (T.
isin
visiorarios
icin
nes y
:o inmtal.
. tests
sfacer
icar a
pronStricalad de
de inin se
u10 8.
impli
3rime-
.entido
de esas
eriales.
y otras
terstipues se
jivo de
as para
917 en
n una
n de la
,39
guerra. La comisin, dirigida por Robert M. Yerkes, reconoci la necesidad de la rpida clasificacin del nivel intelectual general del milln y medio de reclutas. Esta informacin era importante para tomar muchas decisiones administrativas, incluyendo
el rechazo o la dispensa del servicio militar, la asignacin a diferentes servicios o la admisin zi campos de enxenamienco de oficiales. En este ambiente se formul el primer
test colectivo de inteligencia. Para realizar la tarea, los psiclogos acudieran a todos
los materiales disponibles, especialmente a un test colectivo de inteligencia nojublicado, preparado por Arthur S. Otis, que cedi al ejrcito. Una contribucin importante de este instrumento, elaborado por Otis cuando era estudiante en uno de los
cursos de grado de Teman, fue la introduccin de preguntas de opcin mltiple y
otros reactivos "objetivos".
Las pruebas que finalmente desarrollaron los psiclogos del ejrcito podan aplicarse a grupos grandes y llegaron a conocerse como Army Alpha y Army Beta (pruebas
Alfa y Beta). La primera se ocupaba de las pruebas generales de rutina, mientras que la
segunda era una escala no lingstica utilizada con reclutas iletrados o procedentes de
pases cuyo idioma no era el ingis.
Poco despuQ de terminar la Primera Guerra Mundial, las pruebas del ejrcito fueron
liberadas para que se aplicaran a civiles; adems de pasar por muchas revisiones, las
pruebas Alfa y Beta sirvieron como modelo para la mayor parte de los tests colectivos
de inteligencia, lo que contribuy al notable crecimiento del movimiento psicomtrico. Muy pronto-se prepararon tests colectivos de inteligencia para todas las edades y
personas, desde preescolares hasta universitarios. Los programas de evaluacin a gran
escala, otrora imposibles, se emprendieron con gran entusiasmo. Como las pruebas
colectivas fueron diseadas como instrumentos de evaluacin masiva, no s61o pennitieron la medicin simultnea de grandes grupos, sino que tambikn simplificaron las
instrucciones y los procedimientos de aplicacin, con lo que disminuy la capacitacin requerida del aplicador. Los maestros empezaron a aplicar en sus grupos los tests
de inteligencia y los estudiantes universitarios eran evaluados de rutina antes de su ingreso; se iniciaron amplios estudios de grupos especiales de adultos, como los prisioneros, y muy pronto el pblico general cobr conciencia del C1.
La aplicacin de esos tests colectivos excedi a su mejoramiento tcnico. En la prisa por obtener puntuaciones y sacar conclusiones prcticas de los resultados, a menudo se olvidaba que las pruebas an eran tknicamente imperfectas, de modo que
cuando no lograban cumplir las injustificadas expectativas, se generaba escepticismo y
hostilidad hacia todas las pruebas. De este m d o , ei auge psicomtrico de los aos
veinte, basado en el uso indiscriminado de los instrumentos, puede haber demorado el
progreso de las pruebas psicolgicas.
8s
Aunque al principio los tests de inteligencia fueron diseados para cubrir una amplia
variedad de funciones que permitieran estimar el nivel general de inteligencia del individuo, pronto se hizo evidente que su alcance era muy limitado. No todas las funciones
importantes estaban representadas. De hecho, la mayor parte de los tests de inteligencia eran principalmente mediciones de la habilidad verbal y, en menor grado. de la
::
40
habilidad para manejar relaciones numricas y otras relaciones abstractas y simblicas. Gradualmente, los psiclogos .reconocieron que el termino "test de inteligencia"
era un nombre inadecuado, ya que slo medan ciertos aspectos de sta.
Fara que resultaran seguros, los instrumentos tocaban habilidades que son de gran
importancia en la cultura para la qiie fueron disefados, perc pronto se reconoci la
conveniencia de contar con designaciones ms precbas en trminos de la informacin
que podan ofrecer; por ejemplo, ahora se conoce como tests de aptitud escolar a algu- nos instmmentos que en los veinte habran sido llamados de inteligencia. Este cambio
en la terminologa procede del hecho de que muchos de los llamados tests de inteligencia miden la combinacin de habilidades requeridas y fomentadas por el trabajo
universitario.
Incluso antes de la Primera Guerra Mundial, los psiclogos efnpezaban a admitir la
necesidad de contar con tests de aptitudes especiales que complgnentaran los de inteligencia global. En especial, se prepararon pruebas de aptitudes especiales para uso en la
orientacin vocacional y en la seleccin y clasificacin de personal industrial y militar. Entre las ms empleadas estn los tests de aptitud mecnicz, profesiona!, musical y
artstica.
La evaluacin crtica de las pruebas de inteligencia que sigui al uso indiscriminado durante los veinte tambin revel el hecho notable de que el desempeo del
individuo a menudo mostraba una marcada variacin en diferentes partes de la prueba. Esto result6 en especial evidente en las pruebas colectivas, en las que los reactivos
suelen separarse en subpruebas de contenido reiativamente homogneo; por ejemplo,
una persona po& obtener una puntuacin ms bien alta en la subpmeba verbal y un
pobre resultado en la numrica o viceversa. Dicha variabilidad interna es hasta cierto
grado discemible en un test como el Stanford-Binet en el que, por ejemplo, todos los
reactivos que incluyen palabras pueden resultar difciles para cierto individuo, mientras que los que emplean imgenes o diagramas geomtricos pueden resultarle ventajosos.
Los usuarios, y sobre todo los clnicos, a menudo se valan de esas comparaciones
internas para obtener un conocimiento ms profundo de la estructura psicolgica del
individuo. De este modo, al evaluar un caso individual no slo se examinaba el CI o
algn otro resultado global, sino tambin el desempeo en grupos de reactivos o subtests; sin embargo, en general no se recomienda esta prctica, porque los tests de inteligencia no fueron diseados con el propsito de realizar un analisis diferencial de las
aptitudes. Con frecuencia, los subtests comparados contienen muy pocos reactivos para prducir ur.a estimacin estable o confiable de determinada habilidad. Entonces, la
diferencia de las puntuaciones de los subtests se puede revertir si vuelve a examinarse
al individuo otro da o con otra forma del mismo instrumento. Para realizar esas comparaciones en el mismo sujeto, es necesario disear las pruebas con el objeto de que
revclen diferencias de ejecucin en diversas funciones.
Al mismo tiempo que la aplicacin prctica demostraba la necesidad de contar con
mltiples tests de aptitud, un desarrollo paralelo en el estudio de la organizacin de los
rasgos iba proporcionando los medios para elaborarlos. Los estudios estadsticos sobre
la naturaleza de la inteligencia haban explorado las re!aciones entre las puntuaciones
obtenidas por muchas personas en una gran variedad de pruebas. El p&clogo ingls
.'
~ntecedenteshistricos de las pruebas actuales
12"
m
la
in
uio
lijo
la
:e. la
iliJY
nide l
ueVOS
40,
un
TtO
los
.en7ta-
mes
del
21 o
subntee las
5 paS, la
larse
:om: que
con
le los
sobre
lones
ng1i.s
41
"
Charles Spearman (1904, 1927) inici estas investigaciones durante la primera dcada del siglo XX. Los desarrollos metodolgicos subsecuentes, basados en el trabajo de
estudiosos ingleses y estadounidenses, como T. L. Kelley (1928) y L. L. Thurstone
(1938, 1947b), llegaron a conocerse como anlisis factorial.
En el captulo 11 examinaremos de manera exhaustiva las contribuciones de los
mtodos del anlisis factorial en la elaboracin de pruebas. Por ahora basta con destacar que los datos ~btenidoscon estos procedimientos seaiaron la presencia de diversos factores o rasgos relativamente independientes, algunos representados en diversas
proporciones en los tests tradicionales de inteligencia, como, por ejemplo, la comprensin verba! y el razonamiento n~imrico;otros, como la aptitud espacial, perceptual y mecnica, se encuentran ms a menudo en los instrumentos para la medicin
de aptitudes especiales que en los de inteligencia.
Uno de los principales resultados prcticos del anlisis factorial fue el desarrollo de
las baterzs de aptitudes mltiples, diseadas para proporcionar una medida de la posicin del individuo en un&serie de rasgos. En lugar de una puntuacin total, o CI, estos instrumentos obtienen una puntuacin aparte para rasgos como la comprensin
verbal, la aptitud numrica, la visualizacin espacial, el razonamiento aritmtico y la
rapidez perceptual, lo que permite realizar el anlisis intrasujeto o diagnstico diferencial en el mismo sujeto que los usuarios trataron de obtener por muchos aos con los
resultados crudos y a menudo errneos de los tests de inteligencia. Ademh, dado que
cubren algunos de los rasgos que generalmente no se incluan en ese tipo de instrumentos tambikn incorporaron en un programa amplio y sistemtico de evaluacin
gran parte de la informacin que antes se obtena de las pruebas de aptitud especial.
Las bateras de aptitudes mltiples representan un desarrollo relativamente tardo
en el campo de las pruebas, ya que casi todas aparecieron a partir de 1945. A este respecto es de destacar el trabajo de los psiclogos militares durante la Segunda Guerra
Mundial. Gran parte de la investigacin conducida en las fuerzas armadas se bas en
el anlisis de factores y se orient a la preparacin de bateras de aptitudes mltiples;
por ejemplo, en la fuerza area se construyeron bateras especiales para pilotos, bombarderos, operadores de radio, rastreadores y muchos otros especialistas. El informe de
las bateras que elabor la fuerza area ocupa al menos nueve de los 19 voimenes dedicados al programa psicolgico de la aviacin durante la Segunda Guerra Mundial
(Awny Air Fmces, 1947-1948). La investigacin en esas lneas an sigue en progreso
con el patrocinio de varias ramas de las fuerzas armadas. Tambin se han realizado bateras para uso civil y se aplican lo mismo en la orientacin vocacional y educativa
que en la seleccin y clasificacin de personal. En los captulos 10 y 17 presentaremos
algunos ejemplos.
Un adelanto ms reciente, surgido a finales de los ochenta y comienzos de los noventa, permite la integracin de dos metodos al principio contradictorios de medicin
mental representados por los tesri tradiciondles de inteligencia y :zs bateras de aptitudes mltiples (Anastasi, 1994). En la actualidad, se reconoce que la habilidad del
ser humano puede ser evaluada de manera adecuada a diferentes niveles de profundidad,
desde las aptitudes muy definidas de las pruebas especficas (o incluso de reactivos),
pasando por el nivel de los rasgos hasta una puntuacin global como el tradicional
CI. Para cada propsito de evaiuacin hay un nivel apropiado de profundidad. Fn
.. -
Mientras los psiclogos se ocupaban de los tests de inteligencia &de aptitud, los exmenes escolares tradicionales experimentaban avances tcnicos (0.W. Caldwell y
Courtis, 1923; Ebel y Damrin, 1960). Un paso importante en esta direccin lo dieron
las escuelas pblicas de Boston en 1845 cuando los exmenes escritos sustituyeron al
interrogatorio oral de los estudiantes por examinadores visitantes. Enne los argumentos ofrecidos en apoyo de esta innovacin estaba que los exmenes escritos ponan a
los estudiantes en una situacin uniforme, permitan una cobertura ms amplia del
contenido, reducan el elemento azaroso en la eleccin de reactivos y eliminaban la
posibilidad de favoritismo por parte del examinador. Todos estos argumentos tienen
un sonido familiar: fueron utilizados mucho despus para justificar la sustitucin de los
reactivos de ensayo por los reactivos objetivos de opcin mltiple.
A la vuelta del siglo empezaron a aparecer las primeras pmebas estandarizadas para
medir los resultados de la instruccin escolar. Encabezadas por el trabajo de E. L.
Thomdike, las pruebas empleaban principios de medicin tomados del laboratorio
psicolgico. Entre los ejemplos se incluyen escalas para calificar la calidad de la escritura y la redaccin, asi como pruebas de ortografia, aritmtica, dlculo y razonamiento
aritmtico. Despuds llegaron las baterias de aprovechamiento, iniciadas con la publicacin de la primera edicin de la Prueba de Aprovechamiento de Stanford (Stanford
Achievement Test) en 1923. Sus autores fueron tres lderes en la elaboracin de pruebas: Tiuman L. Kelley, Giles M. Ruch y Lewis M. Teman. Presagiando muchas caracteristicas de la psicometra inodema, esta batera proporcion medidas comparables
de ejecucin en diferentes materas escolares, evaluadas en trminos de un solo grupo
normativo.
Al mismo tiempo se acumulaban evidencias de la falta de acuerdo entre los niaestros al calificar las pruebas de ensayo. Para 1930 era ampliamente reconocido que las
pruebas de ensayo no slo requeran ms tiempo para los examinadores y examinados, sino que tambin arrojaban resultados menos confiables que el "nuevo tipo" de
. ~ la medida en que estos ltimos llevaron al uso creciente de
reactivos o b j e t i ~ o sEn
las pruebas estandarizadas de aprovechamiento, hubo un niasis mayor en el diseo
'b investigacidn relacionada con la relativa ehcacia de los reactivos de ensayo y objetivos se trata en el capltulo
17, e n la parte que aborda la utilizacin educativa de las pmebas
..
a,ade
ra:oase
:la-
x!1 y
ron
1 al
entn a
del
n la
nen
e los
corio
xriento
ubli-
nfmd
pruearacabies
,pp
siaesue las
nina%O"de
ite de
liseo
i
E.
43'
de reactivos para probar ia comprensin y la aplicacin del conocimiento y otros objetivos educativos ms amplios. La dcada de los treinta tambien presenci la introduccin de las mquinas para calificar exmenes a las cuales podan adaptarse
fcilmente las nuevas pruebas objetivas.
Otro desarrollo digno de mencin fue el estahlecimientc en los Estados Unidos de
programas estatales, regionales y nacionales de evaluacin. Probablemente el ms conocido sea el de la Junta Universitaria de Exmenes de Admisin a la Universidad (ColleRe Entrame E-nation
Board, CEEB). Establecido a principios de siglo para reducir la
duplicacin de los exmenes de admisin presentados por los estudiantes de reciente
ingreso a la universidad, el programa ha experimentado cambios profundos en sus prccedimientos de evaluacin y en el nmero y la naturaleza de las universidades participantes, cambios que reflejan los adelantos tanto en la aplicacin de pruebas como en la
educacin. En 1947, las funciones de evaluacin del CEEB se combinaron con las de
la Corporacin Camegie y las del Consejo Estadounidense de Educacin para formar el
Servicio de Pruebas Educativas (Edtccational Testing Sewice, ETS). En los aos posteriores, el ETS asumi la responsabilidad de un nmero creciente de programas de evaluacin al servicio de universidades, escuelas profesionales, dependencias gubernamentales
y otras instituciones. Debe hacerse mencin del Programa de Evaluacin de Universidades Estadounidenses (Amerium Coiiege Tesring Program), establecido en 1959 para seleccionar a los aspirantes a las universidades no incluidas en el programa CEEB y de varios
programas nacionales de evaluacin para premiar a los estudiantes talentosos.
Las pruebas de aprovechamiento no s61o se utilizan con propsitos educativos, sino
tambien en la seleccin de solicitantes de empleos en la industria y el gobierno. Ya citamos el uso sistemtico en el servicio civil de exmenes en el imperio chino desde
aproximadamente el ao 150 a.c. (Bowman, 1989). En los tiempos modernos, la seleccin de empleados gubernamentales por medio de exmenes fue introducida en los
pases europeos a finales del siglo XWIIy comienzos del XIX.En 1883, la Comisin del
Servicio Civil de los Estados Unidos (U.S. Civil Seruice Commission) estableci el uso de
exmenes competitivos como procedimiento regular (Kavruck, 1956). Las tcnicas
de elaboracin de pruebas creadas durante y antes de la Primera Guerra Mundial fueron introducidas en el programa de evaluacin del Servicio Civil de los Estados Unidos con el nombramiento de L. J. O'Rourke como director de la recin establecida
divisin de inllestigacin en 1922. En la actualidad, este trabajo lo realiza un boisticado equipo de investigacin de la Oficina de Administracin de Personal de los Estados Unidos (U.S. Ofice of Personnel Management).
En la medida en que creca la participacin de psiclogos con preparacin en psicometra en la formulacin de pruebas estandarizadasde aprovechamiento aumentaba
la semejanza de sus aspectos tcnicos con el de los tests de inteligencia y de aptitud. Los
procedimientos para la elaboracin y evaluacin de todas esas nuevas pruebas tenan
muchc en comn. Los crecientes esfuerzos por preparar
de aprovecham:.ento
que midieran la consecucin de amplias metas educativas, en contraste con el recuerdo de hechos triviales, tambin hizo que el contenido de las pruebas de aprovechamiento se asemejara al de los tests de inteligencia. En la actualidad, la diferencia entre
los dos instrumentos corresponde principalmente al grado de especihcidad del conte,
nido y el grado en que el instrumento presupone una iristruccin previa.
44
Otra rea de inters de las pruebas psicolgicas son los aspectos afectivos o no intelectuales de la conducta, los que revisaremos del captulo 13 al 16. Los instnimentos diseaclos con este propsito suelen conocerse como tests de personalidad, aunque
muchos psiclogos prefieren emp!ear el trmino "fiersonalidad en un sentido ms
amplio para referirse al individuo en su totalidad. De acuerdo con esto, tanto los rasgos intelectuales como los no intelectuales deberan agruparse bajo dicho rubro; sin
embargo, en la terminologa psicomtrica es ms comn el uso de la expresin "test de
personalidad" para referirse a la medicin de caractersticas como los estados emocionales, las relaciones interpersonales, la motivacin, los intereses y las actitudes.
El uso que hizo Kraepelin de la prueba de asociacin libre con pacientes psiquitricos
es un antecedente de los tests de personalidad. En esta prueba, se bresentan al examinado palabras estmulo especialmente seleccionadas y se le pide que responda a cada una.
con la primera palabra que le venya a la mente. Kraepelin (1892) tambin utiliz esta
tcnica para estudiar los efectos psicolgicos de la fatiga, el hambre y las drogas, y concluy que todos esos agentes incrementan la frecuencia relativa de asociaciones superficiales. Sommer (1894), que tambin trabaj en la ltima dcada del siglo XIX, sugiri
que la prueba de asociacin libre podra utilizarse para diferenciar formas de trastorno
mental. Despus, la tcnica ha sido utilizada con distintos prop6sitos de evaluacin y
an sigue emplendose. Debe mencionarse el trabajo de Galton, Pearson y Cattell en la
preparacin de cuestionarios estandarizados y escalas de calificacin. Aunque originalmente estaban destinados a otros propsitos, estos procedimientos fueron utilizados para elaborar algunos de los tests de personalidad que hoy son ms comunes.
El prototipo dc cuestionario de personalidad, o inuentan'o autodescriptivo (captulo
13), es la Hoja de Datos Personales (Personal Data Sheet) creada por Woodworth durante la Primera Guerra Mundial (DuBois, 1970; Franz, 1919, pp. 171-176; L. R.
Goldberg, 1971; Symonds, 1931, captulo 5). El cuestionario fue disenado como una
herramienta de seleccin para identificar a los individuos gravemente pertiirhiiclos que
deberan ser excluidos del servicio militar. El cuestionario constaha dc tina serie de
preguntas que versaban sobre sntomas psicopatolgicos comunes y en las que los individuos respondan sobre s mismos. Se obtena una puntuacin toral, contando el
de sritomas indicados. Este instrumenco no se termin y no pudo emplearse a
tiempo, antes de que terminara la guerra, pero inmediatainente despus se prepiiraron
formas para uso civil, incluyendo una forma especial para aplicar a nifios. Ms an, la
Hoja de Datos Personales de Woodworth sirvi como modelo para la mayor parte de
los inventarios de ajuste emocional. En algunos de estos cuestionarios se haca un iiitento por subdividir el ajuste emocional en formas ms especficas, como el ajuste al
hogar, el escolar y el vocacional. Otros instrumentos se concentraban en un rea ms
estrecha de conducta o en respuestas ms claramente sociales, ccmo las de dominancia-sumisin en cl trato personal. El ltimo avance fue la elaboraci6n de 1nstruinen:os
para cuantificar la expresin de actitudes e intereses (captulo 14), qiic tarnhiii se basaban principalniente en las tcnicas de cuestionario.
Otro mtodo de medicin de la personalidad se encuentra en la aplicacin de tests
situacionales y de ejecucin (captulo 16), en las que el examinado debe rer 1izar una
CI
itelectos diunque
o ms
OS rasro; sin
test de
nocioitricos
iminada unas
7 6 esta
y conuperhsugiri
istorno
ci6n y
11en la
iginaldos paaptulo
rth du; L. R.
no una
los que
erie de
los inindo el
earse a
,araron
an, la
arte de
un iniuste al
ea ms
ninanmentos
i se bade tescs
:ar una
45
tarea cuyo propsito a menudo est encubierto. La mayor parte simula con mucho
realismo situaciones de la vida cotidiana. La primera aplicacin extensa de las tcnicas est e n las pruebas elaboradas por Hartshome, May y colabradores a finales de
los veinte y principios de los treinta (1928, 1923, 1930). Esta serie, estandarizada
para escolares, se interesaba eF conductas tales como copiar, mentir, robar,-cooperar
y persistir. Era posible obtener puntuaciones cuantitativas objetivas e n numerosos
instrumentos especficos. Orro ejemplo, estepara los adulms, se encuentra e n la serie de tests situacionales preparados durante la Segunda Guerra Mundial por el Programa de Evaluacin de la Oficina de Servicios Estratgicos (Offce of Snategic
Seruices, OSS, 1948). Esos tests se interesaban en la conducta emocional y social
sutil y relativamente compleja y su aplicacin requera de condiciones ms bien elaboradas y de personal capacitado, adems de que la interpretacin de las respuestas
era relativamente subjetiva.
Las tcnicas proyectivas (captulo 15) representan el tercer mtodc de estudio de la
personalidad que ha mostrado un crecimiento notable, en especie1 entre los clnicos.
Estos instrumentos presentan al cliente un estmulo no muy estructurado, lo que permite una considerable libertad en su solucin La suposicin que fundamenta este metodo
es que el individuo proyectar mediante el estmulo su estilo caracterstico de respuesta. Como e n los tests situacionales o de ejecucin, el propsito de las tcnicas proyectivas est ms o menos encubierto, lo que reduce la posibilidad de que el individuo
cree deliberadamente una impresin deseable. La prueba de asociacin libre, que ya
citamos, es una de las primeras tcnicas proyectivas. Los tests de frases incompletas
tambin se han utilizado de esta manera. Otras tareas que aparecen e n las tcnicas
proyectivas incluyen el dibujo, el arreglo de juguetes para crear una escena, la dramatizacin extempornea y la interpretacih de manchas de tinta.
Todos los tests de personalidad disponibles presentan ciertas dificultades prcticas y
tericas: Cada mtodo tiene sus propias ventajas y desventajas. En conjunto, los tests
de persona!idad han quedado detrs de los de habilidad encuanto a logros prcticos,
pero esa falta de progreso no puede atribuirse a un esfuerzo insuficiente. La investigaciGn sobre la niedicin de la personalidad ha alcanzado proporciones impresionantes
desde 1950, y muchos instrumentos ingeniosos y mejoras tcnicas estn en investigacin. Lo que explica el lento avance en el 5rea son ms hien las dificultades especficas
que se encuentran en la medicin de la personalidad.
A partir de la investigacin actual c m los tests de personalidad estn surgier.do dos
tendencias unificadoras importantes (vase Anastasi, 1985b, 1992a, 1993; Digman,
1990; L. R. Goldberg, 1993; Simon, 1994). Primera, cada vez hay ms evidencias de la
influencia recproca de los rasgos afectivos (de "personalidad") y cognoscitivos (de
"habilidad") tanto en el desempeo.de tareas como en el desarrollo conductual. Se ha
llegado a la conclusiii de que la distincin tradicional entre los dos rasgos ha sido impuesta artificialmente por razones de conveniencia en la descripcin y medicin de
diferentes aspectos de la conducta. Segunda, el anlisis terico de la naturaleza y composicin de la personalidad apoya la integracin de los rasgos cognoscitivos y afectivos en un modelo aiiiplio de :a actividad humana que incluye todas las formas de
conducta. Este modelo relaciona la investigacin bsics de los rasgos intelectuales
(capkulo 11) y los afectiv~b(capkulo 13).