La Evaluación - Capítulo Feldman
La Evaluación - Capítulo Feldman
La Evaluación - Capítulo Feldman
Capítulo V La evaluación
Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje de los alumnos,
los dispositivos, los métodos o las técnicas de enseñanza, el plan de estudios, materiales,
programas o proyectos, los rendimientos cuantitativos de un sistema, la tarea de los profesores, la
calidad de la gestión institucional. Esas cosas pueden ser evaluadas con distintos propósitos, por
distintas personas y mediante diferentes métodos. Jean-Marie De Ketele (1984) sintetiza los
rasgos de la evaluación en torno de cuatro preguntas: ¿por qué evaluar?, ¿qué evaluar?, ¿cómo
evaluar?, ¿quién evalúa? La respuesta a cada una de ellas muestra la diversidad de propósitos
(certificar, diagnosticar, clasificar, predecir, orientar), de sujetos/objetos de la evaluación (los
estudiantes, la enseñanza, los materiales, los métodos), de técnicas de evaluación (entrevistas,
pruebas, observaciones) y de responsables de la evaluación (heteroevaluación, autoevaluación,
evaluación independiente, etc.). En este apartado se priorizará la evaluación del aprendizaje en la
sala de clases.
Aceptamos que la enseñanza institucional es necesaria para que los alumnos obtengan
determinados aprendizajes, desarrollen ciertas capacidades, adquieran ciertos modos de apreciar
o de valorar. Asumimos, en general, que el mundo adulto tiene algún derecho para decidir cosas
que los jóvenes deberán adquirir para su vida. Éste no es sólo un problema de las escuelas. Toda
sociedad conocida estableció conocimientos, destrezas y disposiciones que los jóvenes debían
adquirir durante su preparación para, luego, formar parte del mundo adulto. Nuestra sociedad
realiza esta preparación principalmente en el sistema escolar. La expresión de nuestras
intenciones educativas tiene un sencillo correlato. Si esto es lo que pretendemos ¿en qué medida
lo estamos logrando? ¿Deberíamos tener algún medio al alcance para saber si las importantes
intenciones educativas de las escuelas son realizadas? Si se considera que estas intenciones
educativas están directamente ligadas con el desarrollo del mundo en que vivimos y que no
resultan accidentales, sino centrales para su existencia y mejora, parece casi inevitable dar una
respuesta positiva. Este es un primer motivo: las acciones de enseñanza tienen tal importancia
social que el hecho de evaluar está vinculado a la importancia otorgada. Pero no es el único. En la
sala de clases todo profesor planifica ciertas realizaciones: resolver una tarea, analizar un
problema, organizar información, diseñar un proyecto, comprobar una hipótesis, debatir un
conflicto, establecer relación entre dos series de hechos, comparar casos para buscar elementos
comunes, conocer una teoría, inventar un concepto, obtener datos de libros o material
informativo, organizar un grupo pequeño, realizar obras en diferentes lenguajes. La lista puede
continuar. En cualquier concepción no directa de la enseñanza se aceptará que estas actividades y
producciones permiten que los alumnos “aprendan algo”. Tanto desde el punto de vista del
profesor como desde el del alumno, es necesario tener algún conocimiento acerca del éxito o la
pertinencia de las actividades emprendidas. O sea, poder evaluar el resultado de la tarea realizada.
En el caso del profesor, para organizar su intervención, planificar los cambios y modular la ayuda
que preste. En el caso de los alumnos, porque el conocimiento acerca de la pertinencia y la
dirección de los propios esfuerzos es un elemento de enorme importancia para mantener la tarea
en marcha y realizar las adecuaciones necesarias. En el caso del sistema, para asegurar el
cumplimiento de requisitos que permiten el paso de los alumnos en los distintos niveles. Según lo
anterior la evaluación forma parte integrante de la acción porque la consideración del resultado
de las acciones es el elemento que permite darles dirección y, si se permite el término, eficacia.
Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas tendencias
pedagógicas vinculadas a lo que se conoce como “tecnología instruccional o, directamente,
tecnicismo. Sin embargo, los seres humanos procuran y necesitan conducir con eficacia sus
acciones para poder resolver los problemas que enfrentan de una manera adecuada y con una
inversión razonable de recursos, energía y tiempo. Gran parte de las vidas humanas consisten en
producir o alcanzar ciertas metas. Por eso es necesario juzgar la capacidad de las acciones
emprendidas de alcanzar las metas propuestas y, así, poder dirigir, modificar o mantener los
esfuerzos. Los seres humanos son evaluadores: en el curso de sus acciones obtienen información,
la comparan con algunos criterios establecidos y toman decisiones en consecuencia. Esos criterios
pueden ser establecidos por el propio sujeto, en acuerdo con otros, o aceptados de otras fuentes a
las que se les reconoce legitimidad. En cualquier caso, una vez establecidos, ofrecen una manera
de juzgar las acciones. La evaluación, entonces, tiene como función principal permitir la toma
fundamentada de decisiones. Para eso se recurre a información lo más sistemática posible y se
realizan ponderaciones o juicios basados en criterios. En las actividades educativas son varias las
decisiones que se pueden tomar. Una de ellas puede ser calificar, aprobar o certificar el
cumplimiento de requisitos. Pero hay otras. Eso lleva al siguiente apartado. Ver el apartado 3 del
Capítulo II de este trabajo.
Hay muchos casos en los que es posible hablar de evaluaciones realizadas de forma permanente y
de manera informal. Por ejemplo, cuando un docente se pregunta: “¿Cómo van las cosas?”,
“¿Están comprendiendo?”. O cuando reflexiona: “Hoy la clase fue buena, pudo notarse en el nivel
de las preguntas y en la discusión final, pero ¿los que no participaron…?”. O también cuando se
preocupa: “Creo que debería disminuir el ritmo”, “Me parece que este tema precisa más
ejercitación”, “Hoy noté muchos errores en la tarea individual”. O al cualificar: “Marta mejoró
mucho en su rendimiento, se esfuerza y parece más animada, habría que apoyarla un poco más
porque, de seguir así, puede aprobar la materia”. Pero, normalmente, la referencia a la evaluación
alude a una dimensión más formalizada. La evaluación se caracteriza por tres rasgos: primero,
obtener información del modo más sistemático posible, en segundo lugar valorar un estado de
cosas, de acuerdo con esa información, en relación con criterios establecidos y, tercero, su
propósito es la toma de decisiones. La evaluación se diferencia de una actividad descriptiva,
porque, como señala Perrenoud, siempre se evalúa para actuar (Perrenoud, 1999a: 53). La
información es necesaria pero no alcanza para la toma de decisiones. Ellas dependen de los juicios
que se elaboran mediante el análisis de la información realizado con ciertos criterios: objetivos,
pautas de desarrollo, modelos, reglas de procedimiento, principios. Como el propósito de la
evaluación es tomar decisiones de distinto nivel, la información que se utilice, los instrumentos
para obtenerla, los criterios y las pautas de valoración dependen del propósito que se quiera
cumplir o, dicho de otra manera, de la decisión que se quiera tomar. Jean-Marie De Ketele
describe posibles propósitos de una evaluación o, en otros términos, un inventario de decisiones
pedagógicas al respecto: Evaluar para certificar: En este caso, se trata de decidir si la persona que
evaluamos posee los conocimientos suficientes para pasar al curso o al ciclo siguiente, o a la vida
profesional, según corresponda. La evaluación debería referirse no a micro-objetivos intermedios
sino a objetivos globales terminales; es decir, a macro-objetivos que integren un número
importante de objetivos intermedios. Como la certificación es una decisión dicotómica –el alumno
tiene o no tiene la competencia mínima–, es fundamental definir bien los criterios en los que la
decisión se fundará. Evaluar para clasificar la población: La decisión –explícita o implícita– consiste
en situar a los sujetos unos en relación con los otros: quién es el primero, el segundo, el último; o
qué nota puede atribuirse a cada uno de ellos: sobresaliente, diez, bueno, suficiente. Evaluar para
hacer el balance de los objetivos intermedios: Es necesario distinguir dos tipos de evaluación-
balance referidas a los objetivos intermedios. En el primer caso, se trata de decidir si el alumno ha
alcanzado los objetivos intermedios requeridos para poder continuar la secuencia de aprendizaje;
en el segundo, de ver en qué medida dio buenos resultados el aprendizaje concerniente a los
objetivos intermedios de perfeccionamiento. Estos dos tipos de evaluación-balance condicionan
las decisiones correctivas. Evaluar para diagnosticar: Este tipo de evaluación permite tomar un
gran número de decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se ha revelado
insatisfactorio. Puede referirse a producciones, a procedimientos utilizados o a procesos mentales
no directamente observables. Evaluar para clasificar en subgrupos: Esta decisión implica la
determinación de subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que
se hayan detectado en los alumnos. Evaluar para seleccionar: Se trata de ordenar los resultados
por orden de importancia, para tomar decisiones sobre ingreso o diferenciación de las personas
evaluadas; esto supone establecer los niveles para establecer la aceptación o derivación. Evaluar
para predecir el éxito: Se trata de una evaluación basada en una investigación anterior que ha
establecido una relación entre predictores y criterios de éxito (por ejemplo, que los niños que
tienen un cociente intelectual superior a 120 en un test determinado aprenden a leer aun cuando
el medio escolar y familiar sean muy desfavorables); supone la estabilidad de las condiciones en
las que se ha observado esa relación; entonces, debe emplearse el mismo test, en las mismas
condiciones de evaluación, para sujetos con características similares a las de los evaluados (De
Ketele, 1984: 30-32). En última instancia el problema que resuelve cada evaluación es singular.
Afortunadamente, los instrumentos, los principios y las reglas de procedimiento de las que se
dispone son generales y existen instrumentos apropiados para muchísimas situaciones. Pero,
como en tantas otras cuestiones educativas, el problema básico no está en los instrumentos, sino
en definir la ocasión para su uso. Esto tiene importancia en el tema de evaluación, donde la
recurrencia a cierto instrumental oscureció, a veces, la deliberación en torno a los propósitos y a
los valores implicados. El instrumento no resuelve el problema sino el uso que hacemos de él. Pero
los problemas no se resuelven sin ser capaces de utilizar el instrumental adecuado. A eso se dedica
el próximo apartado.
La obtención de información constituye el aspecto visible de la evaluación para los alumnos y para
el público en general. Un cuestionario, problemas para resolver, la elaboración de una monografía,
un proyecto o un diseño, un examen escrito de preguntas o de selección múltiple, un examen oral,
una demostración, la observación sistemática de una actividad, una entrevista son maneras de
obtener datos para apreciar algún aspecto del aprendizaje o de las capacidades de las personas. Es
evidente que la información tiene que servir para lo que queremos evaluar. Llamamos a eso
“validez”. También es correcto pretender que la información tenga algún grado de exactitud o
consistencia dentro de los límites del tipo de información buscada. O sea, que aprecie bien el tipo
de cosas sobre las que queremos información y que varíe lo menos posible según sean los ojos que
observen o los oídos que escuchen. Se llama a esto “confiabilidad”. En resumen: para que la
información sea adecuada y de buena calidad, es necesario utilizar instrumentos que reúnan
requisitos de validez y de confiabilidad. Un buen instrumento debería reunir los dos atributos.
Pero en situaciones reales pocas veces se dan en igual medida. Por ejemplo, una entrevista no
estructurada descansa en la atención del entrevistador, en su capacidad de seguir el curso de la
conversación, seleccionar la información relevante, incluir nuevas preguntas o promover nuevos
comentarios. No cuenta, en el momento, con un registro objetivado (aunque pueda consultarlo
después) y su ponderación está sujeta a una serie muy grande de matices. Es posible que existan
diferencias en la apreciación de distintos entrevistadores con lo que baja su grado de
confiabilidad. Sin embargo, en muchas situaciones, la entrevista puede ser considerada el mejor
instrumento para conocer ciertas opiniones, actitudes o capacidades por parte de una persona. Es
válida para eso. En caso de tensión entre validez y confiabilidad, no debería haber duda: es
necesario optar por la validez por la sencilla razón de qué es inútil tener información muy
confiable si no es la información necesaria según los propósitos fijados. Los instrumentos para
obtener información sobre el aprendizaje de los alumnos son como cualquier otro instrumento:
sirven para algunas cosas, pero no para todas y, dentro de las cosas para las que sirven, sirven
mejor para algunas que para otras. Cuando se observa la variedad de propósitos escolares y la
relativa uniformidad de los instrumentos de evaluación sistemática realmente utilizados, se tiene
la impresión de que algo no está del todo bien. O se evalúan pocas cosas de todo lo que se
propone la enseñanza o se está utilizando información insuficiente. Esto se produce, tal vez, por lo
que Perrenoud denomina “la ilusión de la transferencia”: se supone que los rendimientos en un
determinado tipo de prueba muestran una capacidad de otro tipo o utilizable en otras situaciones.
Con información fragmentaria y que toma sólo algunas dimensiones del aprendizaje, se pretende
reconstruir un cuadro completo. El tipo de información que se necesita y, por lo tanto, el tipo de
instrumentos que debería utilizarse, tienen que estar, necesariamente, en función de los
propósitos de cada práctica evaluativa. El instrumental disponible puede agruparse en tres
grandes familias que se definen por la técnica principal utilizada. Grondlund, en un trabajo clásico,
propuso tres tipos de procedimiento: de prueba, de información sobre las personas y de
observación (Grondlund, 1973). 43 Para tratar de modo detallado los conceptos de validez y
confiabilidad puede verse de Camilloni (1998: 76-89). Los procedimientos de prueba consisten en
tareas que los alumnos deben realizar. Es lo que usualmente llamamos “prueba” o “examen”.
Todos los tipos de consignas de una prueba podrían organizarse según dos coordenadas. En una
tenemos las respuestas admitidas. Pueden ser objetivas, si la respuesta debe ser unívoca, como en
el caso de elección múltiple. O, por el contrario, puede ser que las respuestas posibles sean
variables y el análisis admita el juicio subjetivo del profesor, como en el caso de un ensayo, una
pregunta tradicional de respuesta larga o una lección oral. En la otra coordenada, tenemos el tipo
principal de actividad de los alumnos. Puede ser de producción, cuando la respuesta debe ser
elaborada por el alumno, o pueden ser de selección, cuando éste elige la respuesta que cree
correcta de una serie que le ofrece la propia prueba. Es el caso mencionado de la selección
múltiple, del verdadero o falso o del unir con flechas, por ejemplo. Una prueba puede ser
homogénea y recurrir a un solo tipo de ítem de prueba o puede ser armada de modo heterogéneo
y recurrir a consignas de distinto tipo. El lector curioso por el tema encontrará buena bibliografía
con descripción de distintos ítems de prueba, de sus criterios de construcción y de sus utilizaciones
recomendadas. Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la
tarea escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere información sobre
actitudes o intereses, ubicación o percepción de un individuo en el grupo (cuando se trata, por
ejemplo de formar equipos de trabajo), nivel general de conocimiento y también en prácticas de
evaluación conjunta de trabajos entre profesor y alumno. Las entrevistas pueden ser abiertas o
recurrir a formatos preestablecidos. La observación se utiliza cuando se requiere información
sobre un desempeño. En nuestras escuelas, con excepción de la educación deportiva o artística, se
utiliza con más frecuencia en los niveles de la educación inicial y en los segmentos
profesionalizados de la educación, cuando se trata de evaluar desempeños profesionales. También
la observación, como la entrevista, puede realizarse de manera abierta o “natural” o utilizando
guías especificadas para focalizar la atención en determinados aspectos y para registrar la
información.
Los instrumentos son el aspecto más visible. Nos permiten obtener información relevante. Hasta
allí el proceso parece encaminarse hacia una descripción del estado de cosas. En el caso que
estamos tratando, consistiría en una descripción del aprendizaje de los alumnos. Ahora bien, como
ya fue dicho, describir no es equivalente a evaluar. Cuando se evalúa no sólo se describe un estado
de cosas. Principalmente, se aprecia, se valora un estado de cosas en función de un estado posible
o esperado, de un propósito trazado o de un principio de acción. Se lo valora en función de algún
criterio que el evaluador o el sistema de evaluación fijaron. El establecimiento claro de los
propósitos de la evaluación está ligado de manera fundamental con el establecimiento de los
criterios que se utilizarán para valorar la información obtenida y proponer la base para la toma de
decisiones. En la tradición sobre evaluación asentada a partir de los años cincuenta fueron los
objetivos los que ofrecieron la base para elaborar los criterios de evaluación de los aprendizajes.
Como ya se desarrolló el tema en el capítulo anterior, baste decir que los objetivos, en su sentido
clásico, son afirmaciones sobre posibles resultados de aprendizaje. Afirmaciones acerca de lo que
los alumnos podrán saber o serán capaces de hacer. La utilización de objetivos como criterios de
evaluación proviene, principalmente, de la clásica obra de Ralph Tyler, Principios básicos del
currículo. Para Tyler, la escuela es una institución finalista. Por lo tanto, la evaluación debería
consistir en una comparación permanente entre el punto de partida, la situación de un alumno o
grupo de alumnos en un momento del proceso educativo y los puntos esperados de llegada. Por
último, es necesario marcar que, con independencia de los criterios desarrollados, hay distintas
maneras de apreciar la situación de cada alumno con relación a esos criterios. La misma situación
puede ser valorada según diferentes parámetros. Dos de los más usuales son los que pueden
resumirse así: ¿Valorar el rendimiento de un alumno o valorar su esfuerzo? ¿Valorar el nivel
alcanzado o valorar el crecimiento en relación con su punto de partida? La definición de estos
parámetros es importante. En cada caso, hay decisiones pedagógicas implicadas. Aquí se
pretendía, como en otros casos, dejar planteado el asunto.
La calificación
La calificación es una decisión muy frecuente que se toma mediante evaluación escolar. También
es una de las decisiones de más importancia en la vida de profesores y de alumnos. Todos
coincidirán en que la calificación es la expresión de una valoración del desempeño de un alumno.
Pero ¿qué expresa exactamente? Contra la extendida y temprana pretensión de considerar la
calificación como una medida, hoy es difícil aceptar que las prácticas de evaluación escolar
constituyen actos de medición. La calificación, a diferencia de una medida, no expresa una
dimensión sino un conjunto variable de dimensiones. Un examen, en ese sentido puede ser
evaluado, pero no “(...) en el sentido de medirlo, sino de apreciarlo en referencia con una escala
de valor. (...) La calificación sería un medio para resumir apreciaciones de naturaleza diferente a
fin de comunicarlas a un alumno” (Amiguens y Zerbato-Poudou, 1999: 163). La calificación es una
síntesis de la diversidad de dimensiones que componen un producto o una actuación. Pero no es
demasiado informativa acerca de cómo se compuso. Es justamente esa composición la que
expresa las reales capacidades supuestamente evaluadas. En el peor de los casos, la calificación
expresa una impresión general, poco apoyada en información fiable y en análisis sistemático. En el
mejor, la calificación expresa la asignación de un valor promedio en un conjunto posible y, en ese
sentido, ofrece solo una parte incompleta del análisis que la evaluación representa. El enfoque de
objetivos llevó a la propuesta de la pedagogía dominante, a partir de los años cincuenta, que
procuraba la individualización para el avance de cada alumno y se basaba en la combinación de
varios elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los objetivos
de aprendizaje. Segundo, la graduación del nivel de dificultad, provista principalmente por
material instruccional. Por último, una adecuación del ritmo de trabajo y del tiempo disponible a
las capacidades individuales. Se suponía que, de esta manera, la mayoría de los alumnos estaría en
condiciones de alcanzar un nivel aceptable de cumplimiento de los objetivos.
Los nuevos enfoques didácticos dedicaron a la evaluación muy poco desde el punto de vista
propositivo. Quizás, como afirman Amiguens y Zerbato-Poudou (1999: 108), “porque en la mente
de los reformuladores, la evaluación quedó del lado de las obligaciones, la institución y la tradición
de la que querían desembarazarse”. Claro que, desde el punto de vista de la mejora de las
prácticas educativas, esto no deja de ser un inconveniente. Sobre todo, cuando cuesta aceptar
dimensiones de esas prácticas como parte de las pedagogías que uno abraza o admira. La
evaluación es una práctica compleja. Merece ser considerada parte de un proceso formativo y no
simplemente el remate final destinado a la acreditación y el otorgamiento de algún tipo de
credenciales. Si lo planteado hasta aquí es correcto, puede tener una importante función de
regulación sobre el sistema de enseñanza y sobre el proceso de aprendizaje. Es claro que, en ese
sentido, debería ser planificada conjuntamente con las otras actividades y debería ser puesta en
estrecha relación con el modo en que se desarrolló la enseñanza. Si enseñar es dar oportunidades
para aprender, la evaluación debería tener en cuenta estas oportunidades. También, es cierto,
debería tener en cuenta ciertos requisitos de desempeño o de capacidad que se exigirán de los
estudiantes en sus recorridos educativos futuros, tanto dentro del sistema educativo como en
prácticas sociales de todo tipo. Al igual que el currículum, la evaluación juega como una bisagra
entre lo que Lundgren (1992: 71 y siguientes) llama “funciones internas” y “funciones externas” de
la educación. Al menos la necesidad de evaluar coloca sobre la mesa la necesidad de clarificar esas
relaciones. En la determinación de propósitos y en la especificación de criterios descansa la
posibilidad de que la evaluación educativa, que es siempre un medio de control del proceso,
pueda, ella misma, ser evaluada y sometida a juicio por los distintos actores. Por eso, la definición
de las prácticas evaluativas coopera en el proceso conjunto de definición de las intenciones
educativas. Ellas también expresan parte de lo que es valorado y jerarquizado en los aprendizajes.
Y, en esa medida, deberían reflejar algunos de los propósitos importantes de un curso o de un
programa de trabajo. No es fácil que expresen todo. No es tan sencillo sostener esa pretensión de
totalidad en un instrumento de enseñanza. Esto en parte se debe a que, como fue dicho, los
propósitos de las evaluaciones formalizadas (por ejemplo las que se toman con el objeto de
calificar a los estudiantes) no cubren todos los propósitos de un curso. Lo que sí puede esperarse
de ellas es que cubran aspectos sustantivos, que se relacionen con el proceso de enseñanza, que
atiendan a las reales oportunidades de aprendizaje y que expresen los requisitos para los
recorridos futuros de los alumnos cuando ello sea necesario. El tipo de decisiones que deba
tomarse en cada caso será, probablemente, parte de un debate práctico que reúna estas
dimensiones. Como ya se dijo, toda evaluación implica juicio y estos siempre son valoraciones
prácticas que se realizan de manera fundada mediante deliberación.