La Evaluación - Capítulo Feldman

Daniel Feldman. Aportes para el desarrollo curricular. Didáctica General.
Ministerio de Educación de la Nación. Año 2010
Capítulo V La evaluación
La evaluación como parte de las acciones de enseñanza
Muchas cosas pueden ser evaluadas en las actividades educativas: el aprendizaje de los alumnos,
los dispositivos, los métodos o las técnicas de enseñanza, el plan de estudios, materiales,
programas o proyectos, los rendimientos cuantitativos de un sistema, la tarea de los profesores, la
calidad de la gestión institucional. Esas cosas pueden ser evaluadas con distintos propósitos, por
distintas personas y mediante diferentes métodos. Jean-Marie De Ketele (1984) sintetiza los
rasgos de la evaluación en torno de cuatro preguntas: ¿por qué evaluar?, ¿qué evaluar?, ¿cómo
evaluar?, ¿quién evalúa? La respuesta a cada una de ellas muestra la diversidad de propósitos
(certificar, diagnosticar, clasificar, predecir, orientar), de sujetos/objetos de la evaluación (los
estudiantes, la enseñanza, los materiales, los métodos), de técnicas de evaluación (entrevistas,
pruebas, observaciones) y de responsables de la evaluación (heteroevaluación, autoevaluación,
evaluación independiente, etc.). En este apartado se priorizará la evaluación del aprendizaje en la
sala de clases.
La evaluación es un tema delicado porque expresa el ejercicio de la autoridad de la escuela y del

profesor y revela la asimetría del dispositivo escolar. También porque se la usa con propósitos
alejados de su función originaria como, por ejemplo, para imponer ritmo de trabajo, mantener el
orden, sancionar o mostrar “quién manda”. Tampoco para el profesor suele ser una actividad
grata. Cualquiera con experiencia en la enseñanza formal recuerda la fatiga de las largas
correcciones, de ponderar los aciertos y los errores a la hora de calificar y de realizar devoluciones
pertinentes a los alumnos. Sin embargo, la evaluación es una variable de importancia principal en
las actividades educativas escolarizadas. Esto se debe al papel que asignamos a la enseñanza.
Veamos las razones.
Aceptamos que la enseñanza institucional es necesaria para que los alumnos obtengan
determinados aprendizajes, desarrollen ciertas capacidades, adquieran ciertos modos de apreciar
o de valorar. Asumimos, en general, que el mundo adulto tiene algún derecho para decidir cosas
que los jóvenes deberán adquirir para su vida. Éste no es sólo un problema de las escuelas. Toda
sociedad conocida estableció conocimientos, destrezas y disposiciones que los jóvenes debían
adquirir durante su preparación para, luego, formar parte del mundo adulto. Nuestra sociedad
realiza esta preparación principalmente en el sistema escolar. La expresión de nuestras
intenciones educativas tiene un sencillo correlato. Si esto es lo que pretendemos ¿en qué medida
lo estamos logrando? ¿Deberíamos tener algún medio al alcance para saber si las importantes
intenciones educativas de las escuelas son realizadas? Si se considera que estas intenciones
educativas están directamente ligadas con el desarrollo del mundo en que vivimos y que no
resultan accidentales, sino centrales para su existencia y mejora, parece casi inevitable dar una
respuesta positiva. Este es un primer motivo: las acciones de enseñanza tienen tal importancia
social que el hecho de evaluar está vinculado a la importancia otorgada. Pero no es el único. En la
sala de clases todo profesor planifica ciertas realizaciones: resolver una tarea, analizar un
problema, organizar información, diseñar un proyecto, comprobar una hipótesis, debatir un
conflicto, establecer relación entre dos series de hechos, comparar casos para buscar elementos
comunes, conocer una teoría, inventar un concepto, obtener datos de libros o material
informativo, organizar un grupo pequeño, realizar obras en diferentes lenguajes. La lista puede
continuar. En cualquier concepción no directa de la enseñanza se aceptará que estas actividades y
producciones permiten que los alumnos “aprendan algo”. Tanto desde el punto de vista del
profesor como desde el del alumno, es necesario tener algún conocimiento acerca del éxito o la
pertinencia de las actividades emprendidas. O sea, poder evaluar el resultado de la tarea realizada.
En el caso del profesor, para organizar su intervención, planificar los cambios y modular la ayuda
que preste. En el caso de los alumnos, porque el conocimiento acerca de la pertinencia y la
dirección de los propios esfuerzos es un elemento de enorme importancia para mantener la tarea
en marcha y realizar las adecuaciones necesarias. En el caso del sistema, para asegurar el
cumplimiento de requisitos que permiten el paso de los alumnos en los distintos niveles. Según lo
anterior la evaluación forma parte integrante de la acción porque la consideración del resultado
de las acciones es el elemento que permite darles dirección y, si se permite el término, eficacia.
Entre los pedagogos la idea de eficacia quedó muy relacionada con algunas tendencias
pedagógicas vinculadas a lo que se conoce como “tecnología instruccional o, directamente,
tecnicismo. Sin embargo, los seres humanos procuran y necesitan conducir con eficacia sus
acciones para poder resolver los problemas que enfrentan de una manera adecuada y con una
inversión razonable de recursos, energía y tiempo. Gran parte de las vidas humanas consisten en
producir o alcanzar ciertas metas. Por eso es necesario juzgar la capacidad de las acciones
emprendidas de alcanzar las metas propuestas y, así, poder dirigir, modificar o mantener los
esfuerzos. Los seres humanos son evaluadores: en el curso de sus acciones obtienen información,
la comparan con algunos criterios establecidos y toman decisiones en consecuencia. Esos criterios
pueden ser establecidos por el propio sujeto, en acuerdo con otros, o aceptados de otras fuentes a
las que se les reconoce legitimidad. En cualquier caso, una vez establecidos, ofrecen una manera
de juzgar las acciones. La evaluación, entonces, tiene como función principal permitir la toma
fundamentada de decisiones. Para eso se recurre a información lo más sistemática posible y se
realizan ponderaciones o juicios basados en criterios. En las actividades educativas son varias las
decisiones que se pueden tomar. Una de ellas puede ser calificar, aprobar o certificar el
cumplimiento de requisitos. Pero hay otras. Eso lleva al siguiente apartado. Ver el apartado 3 del
Capítulo II de este trabajo.
Tipos funcionales de evaluación
Básicamente, se utiliza la evaluación en el cumplimiento de las siguientes funciones: Formativa:

Regula la acción pedagógica. Pronóstica: Fundamenta una orientación. Diagnóstica: Adecua el
dispositivo de enseñanza a las capacidades del grupo o ubica a un grupo o persona según sus
capacidades actuales en el nivel adecuado para un proceso educativo. Sumativa o compendiada:
Realiza un balance final. En la mayoría de las ocasiones, en los sistemas escolarizados tiene
carácter certificativo e incorpora al balance final un sistema de calificaciones y un régimen de
aprobación y promoción que sostiene la obtención de certificados (de aprobación de un año
escolar, de un curso o nivel o de un título). (Adaptado de Perrenoud, 1999a: 56-57). Quizás la
distinción más importante sea la que diferencia la evaluación formativa, que tiene como propósito
mejorar el desarrollo de las actividades de profesores y alumnos durante el curso, y la evaluación
sumativa, destinada a determinar el resultado total y final del curso. Luego se hará referencia con
más detalle a la evaluación formativa. Aquí queda señalar que la evaluación sumativa puede ser
interna o externa. La evaluación sumativa interna consiste en actividades de evaluación diseñadas
y administradas por el profesor para su clase; es la forma habitual de evaluación (pruebas o
exámenes al finalizar una unidad o un período escolar). La externa es decidida y diseñada por
organismos diferentes al establecimiento y la clase escolar (con independencia de que los
administre el profesor); los operativos nacionales de evaluación de la Argentina son un ejemplo.
En ocasiones, la evaluación sumativa externa tiene carácter certificativo y permite alcanzar alguna
credencial o derecho de acceso a niveles superiores de estudio (por ejemplo, el General Certificate
of Education, O level y A level, en Inglaterra; el Baccalauréat, en Francia y el vestibular, en el Brasil,
que median el paso entre el nivel medio y la universidad en esos países). La distinción entre
“externo” e “interno” es importante porque buena parte de las críticas sobre el papel de la
evaluación provienen de países que sostienen fuertes sistemas de evaluación externa que tienen
influencia directa en los procesos de selección y distribución diferencial de la matrícula escolar.
También tienen un impacto muy apreciable sobre el proceso y las oportunidades formativas de los
alumnos, porque los contenidos y la enseñanza de las escuelas tienden a acomodarse a los
parámetros de los exámenes externos.
De los tipos funcionales de evaluación, la evaluación formativa es la que se encuentra más

estrechamente ligada con el desarrollo de las actividades de aprendizaje. Dicho de manera muy
simple, puede afirmarse que las acciones de enseñanza son eficaces si logran influir sobre las
actividades de los alumnos. Una de las maneras de influir sobre las tareas de aprender consiste en
ofrecer información y valoración sobre la marcha de esas tareas. Ese modo de influencia en las
actividades de aprendizaje es la evaluación formativa. Pero, al mismo tiempo que interviene en las
actividades de aprendizaje, la evaluación formativa interviene en las actividades de enseñanza ya
que la información que brinda permite, al mismo tiempo, evaluar las estrategias utilizadas y
realizar cambios, ajustes o reorganizaciones. La evaluación formativa cumple así una función de
regulación de las actividades de enseñanza y de aprendizaje.
La función reguladora de la evaluación formativa puede cumplirse si se complementa con una

ayuda pedagógica que se diversifica para adecuarse a la individualidad del proceso de aprendizaje.
Si, en última instancia, el aprendizaje es individual, la regulación que promueve la evaluación
formativa sólo puede actuar en la medida que cada aprendiz reciba ayuda adecuada a su
necesidad. Éste es el principio general. La manera de concretarse depende de multitud de
factores. Perrenoud propone considerar formativa una práctica de evaluación continua, si el
profesor tiene la intención de contribuir con las tareas de aprendizaje en curso y mejorarlas,
cualquiera sea el grado en que diferencie la enseñanza (Perrenoud, 1999a: 78)42. El carácter
formativo de la evaluación queda, entonces, según Perrenoud, asociado con el propósito de
participar en la regulación del aprendizaje o, dicho más simplemente, de cooperar con los alumnos
en sus actividades de aprendizaje. Esta cooperación se efectiviza de dos maneras. La primera,
adaptando el ritmo y el tipo de ayuda. La segunda, ofreciendo información a los alumnos acerca de
sus tareas, de sus progresos y de sus dificultades. La evaluación formativa no consiste, sólo, en
cortes evaluativos en el proceso de enseñanza a efectos de utilizar secuencias didácticas de
recuperación o remediales. Según Perrenoud, lo formativo reside en su capacidad de ayudar a los
alumnos a aprender y no en la modalidad de evaluación. Perrenoud, 1999a: 103.) Tampoco cree
que se deba asociar con un tipo especial de intervención pedagógica. “Se puede ayudar de muchas
maneras a los alumnos y lo que se debe procurar es una ampliación de las intervenciones.” Por
último queda una importante pregunta: ¿La evaluación constituye una actividad de tipo diferente
o un énfasis distinto en el continuo de la actividad? Seguramente, la respuesta varía según sea la
función que se enfatice. Por ejemplo, desde el punto de vista de la función formativa, la
evaluación es un momento de la actividad escolar que se distingue más por la dramatización de la
situación que por las tareas realizadas (Perrenoud, 1999ª: 41). Probablemente, las funciones
sumativas o certificativa requieran momentos diferenciados. No es una cuestión de solemnidad.
Hace, entre otras cosas, a la mayor transparencia del proceso cuando se ponen en juego
decisiones de orden social. De lo anterior puede concluirse que la evaluación cumple,
simultáneamente, diversas funciones. Por un lado, cumple una importante función con relación al
aprendizaje. La mayoría de las teorías que hoy se aceptan piensan en el aprendizaje como una
serie de aproximaciones sucesivas y de realizaciones más o menos exitosas. Es difícil encontrar
quien sostenga una posición binaria, tipo “todo o nada”, con relación al aprendizaje. Más bien, se
tiende a aceptar que el aprendizaje implica (en cualquier tipo de camino que se elija) un conjunto
de esfuerzos que acercan al aprendiz al dominio de cierto conocimiento o de ciertas capacidades.
En cualquier proceso de este tipo, el conocimiento del avance de los propios esfuerzos tiene gran
importancia. La evaluación que es, en gran medida, un proceso de información y establecimiento
de posiciones con relación a un sistema de criterios o de parámetros, puede ofrecer el
conocimiento necesario para adecuar los esfuerzos y redireccionar la tarea. La evaluación también
permite regular el sistema de enseñanza: tanto por la información sobre el avance de los alumnos,
como por dar información sobre el propio proceso de enseñanza y su adecuación a los propósitos
fijados. Como parte de un sistema formativo la evaluación relaciona y articula las características de
los alumnos y las del sistema de enseñanza. En algunos casos asegura que las características de los
alumnos correspondan a las exigencias del sistema de enseñanza. Esto lo hace tanto con
evaluaciones de tipo pronóstico (como las que se utilizan en entrevistas de admisión o de
orientación) como en evaluaciones finales tendientes a la certificación de conocimientos o
capacidades de los alumnos. En otros casos, la evaluación asegura que la enseñanza corresponde a
las características de los alumnos. Mediante evaluación en proceso se adaptan las actividades, el
tipo de tareas o su ritmo para adecuarlas al aprendizaje de grupos particulares de alumnos. Por
supuesto, estas dos funciones pueden combinarse en un mismo curso. Por último, es importante
señalar que todo proceso de evaluación del aprendizaje apunta, simultáneamente, en varios
sentidos. Esto es así, porque al evaluar el aprendizaje se ponen en cuestión otras dimensiones. En
primer lugar, la enseñanza y el desempeño del profesor. Como ya se vio en el Capítulo II, según el
enfoque al que se recurra varía el grado de responsabilidad que se le adjudica a la enseñanza
sobre los resultados de aprendizaje de los alumnos. Pero en cualquier caso siempre se acepta que
tiene una importancia considerable. De modo que evaluar el aprendizaje también es una manera
de evaluar la propia tarea. Puede decirse que al evaluar el aprendizaje se analiza también el
desempeño del docente como enseñante, el propio plan de trabajo e inclusive las prácticas de
evaluación.
Al final, ¿a qué se llama “evaluar”?
Hay muchos casos en los que es posible hablar de evaluaciones realizadas de forma permanente y
de manera informal. Por ejemplo, cuando un docente se pregunta: “¿Cómo van las cosas?”,
“¿Están comprendiendo?”. O cuando reflexiona: “Hoy la clase fue buena, pudo notarse en el nivel
de las preguntas y en la discusión final, pero ¿los que no participaron…?”. O también cuando se
preocupa: “Creo que debería disminuir el ritmo”, “Me parece que este tema precisa más
ejercitación”, “Hoy noté muchos errores en la tarea individual”. O al cualificar: “Marta mejoró
mucho en su rendimiento, se esfuerza y parece más animada, habría que apoyarla un poco más
porque, de seguir así, puede aprobar la materia”. Pero, normalmente, la referencia a la evaluación
alude a una dimensión más formalizada. La evaluación se caracteriza por tres rasgos: primero,
obtener información del modo más sistemático posible, en segundo lugar valorar un estado de
cosas, de acuerdo con esa información, en relación con criterios establecidos y, tercero, su
propósito es la toma de decisiones. La evaluación se diferencia de una actividad descriptiva,
porque, como señala Perrenoud, siempre se evalúa para actuar (Perrenoud, 1999a: 53). La
información es necesaria pero no alcanza para la toma de decisiones. Ellas dependen de los juicios
que se elaboran mediante el análisis de la información realizado con ciertos criterios: objetivos,
pautas de desarrollo, modelos, reglas de procedimiento, principios. Como el propósito de la
evaluación es tomar decisiones de distinto nivel, la información que se utilice, los instrumentos
para obtenerla, los criterios y las pautas de valoración dependen del propósito que se quiera
cumplir o, dicho de otra manera, de la decisión que se quiera tomar. Jean-Marie De Ketele
describe posibles propósitos de una evaluación o, en otros términos, un inventario de decisiones
pedagógicas al respecto: Evaluar para certificar: En este caso, se trata de decidir si la persona que
evaluamos posee los conocimientos suficientes para pasar al curso o al ciclo siguiente, o a la vida
profesional, según corresponda. La evaluación debería referirse no a micro-objetivos intermedios
sino a objetivos globales terminales; es decir, a macro-objetivos que integren un número
importante de objetivos intermedios. Como la certificación es una decisión dicotómica –el alumno
tiene o no tiene la competencia mínima–, es fundamental definir bien los criterios en los que la
decisión se fundará. Evaluar para clasificar la población: La decisión –explícita o implícita– consiste
en situar a los sujetos unos en relación con los otros: quién es el primero, el segundo, el último; o
qué nota puede atribuirse a cada uno de ellos: sobresaliente, diez, bueno, suficiente. Evaluar para
hacer el balance de los objetivos intermedios: Es necesario distinguir dos tipos de evaluación-
balance referidas a los objetivos intermedios. En el primer caso, se trata de decidir si el alumno ha
alcanzado los objetivos intermedios requeridos para poder continuar la secuencia de aprendizaje;
en el segundo, de ver en qué medida dio buenos resultados el aprendizaje concerniente a los
objetivos intermedios de perfeccionamiento. Estos dos tipos de evaluación-balance condicionan
las decisiones correctivas. Evaluar para diagnosticar: Este tipo de evaluación permite tomar un
gran número de decisiones de ajuste o “de regulación”. Se utiliza cuando el balance se ha revelado
insatisfactorio. Puede referirse a producciones, a procedimientos utilizados o a procesos mentales
no directamente observables. Evaluar para clasificar en subgrupos: Esta decisión implica la
determinación de subgrupos, homogéneos o heterogéneos, según los casos y las necesidades que
se hayan detectado en los alumnos. Evaluar para seleccionar: Se trata de ordenar los resultados
por orden de importancia, para tomar decisiones sobre ingreso o diferenciación de las personas
evaluadas; esto supone establecer los niveles para establecer la aceptación o derivación. Evaluar
para predecir el éxito: Se trata de una evaluación basada en una investigación anterior que ha
establecido una relación entre predictores y criterios de éxito (por ejemplo, que los niños que
tienen un cociente intelectual superior a 120 en un test determinado aprenden a leer aun cuando
el medio escolar y familiar sean muy desfavorables); supone la estabilidad de las condiciones en
las que se ha observado esa relación; entonces, debe emplearse el mismo test, en las mismas
condiciones de evaluación, para sujetos con características similares a las de los evaluados (De
Ketele, 1984: 30-32). En última instancia el problema que resuelve cada evaluación es singular.
Afortunadamente, los instrumentos, los principios y las reglas de procedimiento de las que se
dispone son generales y existen instrumentos apropiados para muchísimas situaciones. Pero,
como en tantas otras cuestiones educativas, el problema básico no está en los instrumentos, sino
en definir la ocasión para su uso. Esto tiene importancia en el tema de evaluación, donde la
recurrencia a cierto instrumental oscureció, a veces, la deliberación en torno a los propósitos y a
los valores implicados. El instrumento no resuelve el problema sino el uso que hacemos de él. Pero
los problemas no se resuelven sin ser capaces de utilizar el instrumental adecuado. A eso se dedica
el próximo apartado.
Los instrumentos para obtener información
La obtención de información constituye el aspecto visible de la evaluación para los alumnos y para
el público en general. Un cuestionario, problemas para resolver, la elaboración de una monografía,
un proyecto o un diseño, un examen escrito de preguntas o de selección múltiple, un examen oral,
una demostración, la observación sistemática de una actividad, una entrevista son maneras de
obtener datos para apreciar algún aspecto del aprendizaje o de las capacidades de las personas. Es
evidente que la información tiene que servir para lo que queremos evaluar. Llamamos a eso
“validez”. También es correcto pretender que la información tenga algún grado de exactitud o
consistencia dentro de los límites del tipo de información buscada. O sea, que aprecie bien el tipo
de cosas sobre las que queremos información y que varíe lo menos posible según sean los ojos que
observen o los oídos que escuchen. Se llama a esto “confiabilidad”. En resumen: para que la
información sea adecuada y de buena calidad, es necesario utilizar instrumentos que reúnan
requisitos de validez y de confiabilidad. Un buen instrumento debería reunir los dos atributos.
Pero en situaciones reales pocas veces se dan en igual medida. Por ejemplo, una entrevista no
estructurada descansa en la atención del entrevistador, en su capacidad de seguir el curso de la
conversación, seleccionar la información relevante, incluir nuevas preguntas o promover nuevos
comentarios. No cuenta, en el momento, con un registro objetivado (aunque pueda consultarlo
después) y su ponderación está sujeta a una serie muy grande de matices. Es posible que existan
diferencias en la apreciación de distintos entrevistadores con lo que baja su grado de
confiabilidad. Sin embargo, en muchas situaciones, la entrevista puede ser considerada el mejor
instrumento para conocer ciertas opiniones, actitudes o capacidades por parte de una persona. Es
válida para eso. En caso de tensión entre validez y confiabilidad, no debería haber duda: es
necesario optar por la validez por la sencilla razón de qué es inútil tener información muy
confiable si no es la información necesaria según los propósitos fijados. Los instrumentos para
obtener información sobre el aprendizaje de los alumnos son como cualquier otro instrumento:
sirven para algunas cosas, pero no para todas y, dentro de las cosas para las que sirven, sirven
mejor para algunas que para otras. Cuando se observa la variedad de propósitos escolares y la
relativa uniformidad de los instrumentos de evaluación sistemática realmente utilizados, se tiene
la impresión de que algo no está del todo bien. O se evalúan pocas cosas de todo lo que se
propone la enseñanza o se está utilizando información insuficiente. Esto se produce, tal vez, por lo
que Perrenoud denomina “la ilusión de la transferencia”: se supone que los rendimientos en un
determinado tipo de prueba muestran una capacidad de otro tipo o utilizable en otras situaciones.
Con información fragmentaria y que toma sólo algunas dimensiones del aprendizaje, se pretende
reconstruir un cuadro completo. El tipo de información que se necesita y, por lo tanto, el tipo de
instrumentos que debería utilizarse, tienen que estar, necesariamente, en función de los
propósitos de cada práctica evaluativa. El instrumental disponible puede agruparse en tres
grandes familias que se definen por la técnica principal utilizada. Grondlund, en un trabajo clásico,
propuso tres tipos de procedimiento: de prueba, de información sobre las personas y de
observación (Grondlund, 1973). 43 Para tratar de modo detallado los conceptos de validez y
confiabilidad puede verse de Camilloni (1998: 76-89). Los procedimientos de prueba consisten en
tareas que los alumnos deben realizar. Es lo que usualmente llamamos “prueba” o “examen”.
Todos los tipos de consignas de una prueba podrían organizarse según dos coordenadas. En una
tenemos las respuestas admitidas. Pueden ser objetivas, si la respuesta debe ser unívoca, como en
el caso de elección múltiple. O, por el contrario, puede ser que las respuestas posibles sean
variables y el análisis admita el juicio subjetivo del profesor, como en el caso de un ensayo, una
pregunta tradicional de respuesta larga o una lección oral. En la otra coordenada, tenemos el tipo
principal de actividad de los alumnos. Puede ser de producción, cuando la respuesta debe ser
elaborada por el alumno, o pueden ser de selección, cuando éste elige la respuesta que cree
correcta de una serie que le ofrece la propia prueba. Es el caso mencionado de la selección
múltiple, del verdadero o falso o del unir con flechas, por ejemplo. Una prueba puede ser
homogénea y recurrir a un solo tipo de ítem de prueba o puede ser armada de modo heterogéneo
y recurrir a consignas de distinto tipo. El lector curioso por el tema encontrará buena bibliografía
con descripción de distintos ítems de prueba, de sus criterios de construcción y de sus utilizaciones
recomendadas. Las entrevistas son instrumentos utilizados en muchas áreas de actividad. En la
tarea escolar, la entrevista puede utilizarse, por ejemplo, cuando se requiere información sobre
actitudes o intereses, ubicación o percepción de un individuo en el grupo (cuando se trata, por
ejemplo de formar equipos de trabajo), nivel general de conocimiento y también en prácticas de
evaluación conjunta de trabajos entre profesor y alumno. Las entrevistas pueden ser abiertas o
recurrir a formatos preestablecidos. La observación se utiliza cuando se requiere información
sobre un desempeño. En nuestras escuelas, con excepción de la educación deportiva o artística, se
utiliza con más frecuencia en los niveles de la educación inicial y en los segmentos
profesionalizados de la educación, cuando se trata de evaluar desempeños profesionales. También
la observación, como la entrevista, puede realizarse de manera abierta o “natural” o utilizando
guías especificadas para focalizar la atención en determinados aspectos y para registrar la
información.
Los criterios para valorar
Los instrumentos son el aspecto más visible. Nos permiten obtener información relevante. Hasta
allí el proceso parece encaminarse hacia una descripción del estado de cosas. En el caso que
estamos tratando, consistiría en una descripción del aprendizaje de los alumnos. Ahora bien, como
ya fue dicho, describir no es equivalente a evaluar. Cuando se evalúa no sólo se describe un estado
de cosas. Principalmente, se aprecia, se valora un estado de cosas en función de un estado posible
o esperado, de un propósito trazado o de un principio de acción. Se lo valora en función de algún
criterio que el evaluador o el sistema de evaluación fijaron. El establecimiento claro de los
propósitos de la evaluación está ligado de manera fundamental con el establecimiento de los
criterios que se utilizarán para valorar la información obtenida y proponer la base para la toma de
decisiones. En la tradición sobre evaluación asentada a partir de los años cincuenta fueron los
objetivos los que ofrecieron la base para elaborar los criterios de evaluación de los aprendizajes.
Como ya se desarrolló el tema en el capítulo anterior, baste decir que los objetivos, en su sentido
clásico, son afirmaciones sobre posibles resultados de aprendizaje. Afirmaciones acerca de lo que
los alumnos podrán saber o serán capaces de hacer. La utilización de objetivos como criterios de
evaluación proviene, principalmente, de la clásica obra de Ralph Tyler, Principios básicos del
currículo. Para Tyler, la escuela es una institución finalista. Por lo tanto, la evaluación debería
consistir en una comparación permanente entre el punto de partida, la situación de un alumno o
grupo de alumnos en un momento del proceso educativo y los puntos esperados de llegada. Por
último, es necesario marcar que, con independencia de los criterios desarrollados, hay distintas
maneras de apreciar la situación de cada alumno con relación a esos criterios. La misma situación
puede ser valorada según diferentes parámetros. Dos de los más usuales son los que pueden
resumirse así: ¿Valorar el rendimiento de un alumno o valorar su esfuerzo? ¿Valorar el nivel
alcanzado o valorar el crecimiento en relación con su punto de partida? La definición de estos
parámetros es importante. En cada caso, hay decisiones pedagógicas implicadas. Aquí se
pretendía, como en otros casos, dejar planteado el asunto.
La calificación
La calificación es una decisión muy frecuente que se toma mediante evaluación escolar. También
es una de las decisiones de más importancia en la vida de profesores y de alumnos. Todos
coincidirán en que la calificación es la expresión de una valoración del desempeño de un alumno.
Pero ¿qué expresa exactamente? Contra la extendida y temprana pretensión de considerar la
calificación como una medida, hoy es difícil aceptar que las prácticas de evaluación escolar
constituyen actos de medición. La calificación, a diferencia de una medida, no expresa una
dimensión sino un conjunto variable de dimensiones. Un examen, en ese sentido puede ser
evaluado, pero no “(...) en el sentido de medirlo, sino de apreciarlo en referencia con una escala
de valor. (...) La calificación sería un medio para resumir apreciaciones de naturaleza diferente a
fin de comunicarlas a un alumno” (Amiguens y Zerbato-Poudou, 1999: 163). La calificación es una
síntesis de la diversidad de dimensiones que componen un producto o una actuación. Pero no es
demasiado informativa acerca de cómo se compuso. Es justamente esa composición la que
expresa las reales capacidades supuestamente evaluadas. En el peor de los casos, la calificación
expresa una impresión general, poco apoyada en información fiable y en análisis sistemático. En el
mejor, la calificación expresa la asignación de un valor promedio en un conjunto posible y, en ese
sentido, ofrece solo una parte incompleta del análisis que la evaluación representa. El enfoque de
objetivos llevó a la propuesta de la pedagogía dominante, a partir de los años cincuenta, que
procuraba la individualización para el avance de cada alumno y se basaba en la combinación de
varios elementos. Primero, una adecuada planificación, sistemática y jerarquizada, de los objetivos
de aprendizaje. Segundo, la graduación del nivel de dificultad, provista principalmente por
material instruccional. Por último, una adecuación del ritmo de trabajo y del tiempo disponible a
las capacidades individuales. Se suponía que, de esta manera, la mayoría de los alumnos estaría en
condiciones de alcanzar un nivel aceptable de cumplimiento de los objetivos.
La calificación, entonces, es una expresión limitada de un rendimiento educativo. Sin embargo

resulta necesaria, dentro de sus límites. Fundamentalmente, en relación con la función
certificadora de la evaluación. Y esta función mantiene su vigencia en todos los niveles del sistema
de educación escolarizada. La evaluación educativa y sus resultados no son hechos privados.
Forman parte de prácticas públicas que implican acreditación y comunicación: a los estudiantes, a
los padres, a la comunidad, a autoridades o a instituciones con los cuáles los estudiantes
interactuarán en el futuro. Con independencia de la discusión sobre su carácter, puede
concordarse en que la calificación expresa valores que se distribuyen según algún tipo de escala.
No es lo mismo un “aprobado-desaprobado”, que una escala conceptual, por letras o numérica.
Todo sistema de calificación recurre a un tipo de escala. Es importante conocer sus fundamentos,
porque las escalas permiten, o impiden, distinto tipo de operaciones entre sus valores. Por
ejemplo, la habitual realización de promedios que forma parte de los requerimientos
administrativos que, en ocasiones, fuerza las escalas en las que están expresadas las calificaciones
(el bien +, por citar un caso). También dejan en evidencia que, cuando se utilizan escalas ordinales
numéricas, el promedio no puede ser interpretado de manera literal: un “4” no quiere decir que el
alumno sepa la mitad de “8”. Sobre sistemas de calificación el lector interesado encontrará
trabajos muy informados.
Posibles sesgos en la ponderación de la información
Se constataron una cantidad de efectos sistemáticos que influyen o sesgan la ponderación de la

información que dan las pruebas de los alumnos. El primer efecto puede llamarse de
“normalización”. Parece existir entre los profesores, una tendencia a distribuir las notas según una
curva normal (el típico “sombrero de Gauss”). O sea, muchos profesores tienden a establecer una
proporción más o menos pareja de notas buenas, regulares y malas, sean cuáles fueren las
características de los exámenes. También parece influir el orden en el que se corrigen los
exámenes: los primeros suelen obtener mejores notas que los últimos en ser corregidos. Está
bastante constatada la existencia de un efecto de “contraste”. Por este efecto, la calificación
otorgada a un trabajo depende, en alguna medida, de la impresión acerca de los trabajos
anteriores. Un trabajo que obtendría una nota mediana en un lote de trabajos de calidad superior,
puede obtener una nota buena si es corregido junto con trabajos de calidad inferior (Amiguens y
Zerbato-Poudou, 1999: 164-165). De lo anterior se pueden extraer dos conclusiones. La primera es
que buena parte de la actividad de evaluación involucra una comparación entre exámenes o casos
que se realiza en cada práctica de corrección. Esto lleva a una conclusión aun más importante: el
análisis del trabajo de los alumnos no se realiza mediante la comparación genérica entre conjuntos
de información y criterios objetivos. La evaluación se realiza en base a un modelo de referencia
que el profesor desarrolla. Respecto de este tema, puede consultarse, por ejemplo, el claro y
completo trabajo de Alicia Camilloni (1998). El modelo de referencia que actúa como patrón
personal de evaluación no es absolutamente fijo. Se reactualiza y estabiliza en cada momento
específico de evaluación. En el inicio de cada tarea evaluativa, algunas informaciones actúan como
“anclas” (Amiguens y Zerbato-Poudou, 1999: 165) o puntos de referencia en función de las cuáles
se activa el modelo de referencia del profesor. Podría agregarse que este modelo de referencia
estaría conformado tanto por las anclas constituidas durante el primer lote de trabajos corregidos
o de los primeros alumnos entrevistados como por lo que Alicia Camilloni denominó “las
apreciaciones personales del profesor”. Estas apreciaciones constituyen “sesgos” o desviaciones
sistemáticas, influidas por algún tipo de creencia o juicio previo, que actúan sobre el tipo de
información priorizada y sobre la valoración que cada profesor realiza de esa información. Por
ejemplo, el “efecto de halo” consiste en evaluar un aspecto en función de la impresión personal
general sobre el individuo. A la inversa, “la hipótesis de la personalidad implícita” se basa en algún
rasgo que se generaliza a los demás desempeños. También se verifica como causa de distorsión en
las apreciaciones la primacía de la primera o de la última impresión y, lo que se dio en llamar, “la
ecuación personal del profesor”, que sintetiza una tendencia valorativa general personal que
impulsa a ser riguroso o benevolente. La función que tenga una práctica evaluativa también
modifica los modos de valorar. Lo jerarquizado cambia. Como señalan Amigues y Zerbato-Poudou:
“El trabajo del maestro que evalúa tareas en su clase no corresponde al del mismo maestro que las
califica después de un examen” (1999: 216). Es muy probable que en un examen con propósitos de
certificación se pondere más el nivel. En las calificaciones otorgadas en el curso de la clase es
posible que el esfuerzo o el avance de un alumno sean muy tenidos en cuenta con independencia
del nivel alcanzado en ese momento. Hasta ahora se mencionaron sesgos introducidos en la
apreciación del evaluador como efecto de diferentes factores: serie de corrección, tendencia a la
normalización, propósitos, creencias. ¿Puede eliminarse su influencia? Probablemente, no, salvo
que se utilice únicamente instrumentos objetivos. Por lo que ya se vio tal homogeneidad parece
desaconsejable habida cuenta de la diversidad de propósitos de las prácticas evaluativas.
¿Entonces? ¿Hay que asumir que, inevitablemente, distintos sesgos perturbarán la capacidad de
apreciar los resultados de los alumnos? Quizás influirán, pero pueden ser controlados de varias
maneras. La primera es, simplemente, conocerlos. Por lo tanto, hacerlos pasibles de reflexión
cuando se analizan las propias prácticas. También pueden utilizarse recursos técnicos. El primero,
y más importante quizás, es la clarificación de los criterios. También pueden controlarse los
efectos de orden y contraste modificando el orden en el que se corrige y se revisa. Por ejemplo,
cuando uno trata de constatar si dos pruebas de “6” o tres de “8” son más o menos equivalentes
entre sí. Se puede corregir una pregunta de cada prueba en un orden y, luego, otra en otro orden.
Claro, se necesita realizar al final una lectura completa de cada examen para tener una imagen de
conjunto. La recurrencia a pautas de corrección o cuadros de corrección, ayuda a revisar cada
prueba con un esquema relativamente equivalente y a sistematizar también la información
proveniente del análisis. La elaboración de estas pautas se basa en una desagregación de los
elementos principales que debería contener la respuesta o de los criterios a los que debería
atenerse. Y siempre está el recurso de la lectura y el comentario por más de un evaluador. Se trata
de un mecanismo difícil de utilizar en las condiciones normales de desempeño docente; sin
embargo, es uno de los recursos más importantes para el esclarecimiento de pautas. Permite una
progresiva mejora en las apreciaciones y un incremento de las variables consideradas, aunque solo
sea por la convergencia de distintas miradas. En muchas ocasiones, alcanza con el comentario y el
debate sobre algunos casos bien elegidos. La discusión sobre esos casos suele sistematizar
elementos de importancia y valor para el resto del trabajo y de otros procesos de evaluación.
Relaciones entre programación, enseñanza y evaluación Las intenciones para la enseñanza se fijan
en planes de estudio y en programas de trabajo. Pero, según Perrenoud, los planes suelen
adolecer de un defecto: “dicen lo que se debe enseñar pero no lo que los alumnos deben
aprender” (Perrenoud, 1999a: 30). De hecho, quien analice los programas de cualquier nivel
probablemente encontrará dificultades para saber con claridad cuáles son las pautas que deberán
cumplir los alumnos: ¿Deben dominar todo el programa? ¿Deben dominar todas las partes por
igual? ¿Cuál es el nivel con el que se espera que dominen eso? ¿Qué tipos de cosas deben saber o
qué desempeño deben tener? Por otra parte, ¿todo lo que se programa para la enseñanza es
pasible de ser evaluado? Y si lo es, ¿para tomar cualquier tipo de decisión? Las preguntas
ejemplifican una zona gris en relación con la evaluación que es bueno dejar señalada: la de su
extensión en relación con la enseñanza y el aprendizaje. Para algunos, “la evaluación es más
determinante que los programas en el desarrollo de una enseñanza” (Perrenoud, 1999b: 101) La
afirmación es un poco fuerte pero, seguro, tiene algo de cierto, porque la evaluación se relaciona
con la enseñanza de un modo íntimo. No solo “comprueba” el alcance. La evaluación forma parte
del programa de enseñanza escrito o no escrito. Normalmente, adquieren prioridad aquellas
enseñanzas que promueven aprendizajes-requisitos para el grado o nivel siguiente. El profesor del
año anterior es evaluado por la capacidad y el conocimiento de los alumnos que salen de sus
manos. Para los alumnos, las prácticas de evaluación suelen convertirse en el “verdadero
mensaje”, tanto sobre los contenidos como sobre los énfasis en el esfuerzo: establecen una
jerarquía en la tarea de la clase. Es evidente que evaluación y programa forman parte de un mismo
sistema y, por eso, “más vale reformar simultáneamente programas y procedimientos de
evaluación” (Perrenoud, 1999b: 102). Un último comentario sobre el tema. Se puede constatar
una estrecha relación entre evaluación y currículum en los países que cuentan con fuertes
sistemas de exámenes externos. En esos casos, el examen externo “tira” –tracciona– del contenido
del currículum y de las formas de enseñanza, que tienden a adaptarse a las exigencias por venir.
Esta relación está marcada por la autonomía que estos exámenes alcanzan y por la reducción que,
en general, operan sobre las dimensiones evaluadas. Se debe reconocer que, en cualquier
circunstancia, la evaluación modula el currículum. No se sugiere que lo reemplaza o que constituye
un currículum paralelo. Pero sí que genera un sistema de jerarquías y énfasis que da forma
especial al contenido de la enseñanza. Se convierten en más importantes los temas evaluados, se
vuelven más relevantes los tipos de producción exigidas. Podría decirse que los estudiantes crean
modelos de referencia sobre lo que es considerado importante en la clase. Los propios profesores
se ven influidos en la enseñanza y el énfasis en ciertos contenidos, por las formas de evaluar y por
los temas evaluados que la tradición del establecimiento, el departamento o la cátedra fueron
asentando. Puede agregarse que, cuánto más afirmada está la función de certificación de la
evaluación, más actúa como moduladora del currículum.
¿Qué hacer con la evaluación?
Los nuevos enfoques didácticos dedicaron a la evaluación muy poco desde el punto de vista
propositivo. Quizás, como afirman Amiguens y Zerbato-Poudou (1999: 108), “porque en la mente
de los reformuladores, la evaluación quedó del lado de las obligaciones, la institución y la tradición
de la que querían desembarazarse”. Claro que, desde el punto de vista de la mejora de las
prácticas educativas, esto no deja de ser un inconveniente. Sobre todo, cuando cuesta aceptar
dimensiones de esas prácticas como parte de las pedagogías que uno abraza o admira. La
evaluación es una práctica compleja. Merece ser considerada parte de un proceso formativo y no
simplemente el remate final destinado a la acreditación y el otorgamiento de algún tipo de
credenciales. Si lo planteado hasta aquí es correcto, puede tener una importante función de
regulación sobre el sistema de enseñanza y sobre el proceso de aprendizaje. Es claro que, en ese
sentido, debería ser planificada conjuntamente con las otras actividades y debería ser puesta en
estrecha relación con el modo en que se desarrolló la enseñanza. Si enseñar es dar oportunidades
para aprender, la evaluación debería tener en cuenta estas oportunidades. También, es cierto,
debería tener en cuenta ciertos requisitos de desempeño o de capacidad que se exigirán de los
estudiantes en sus recorridos educativos futuros, tanto dentro del sistema educativo como en
prácticas sociales de todo tipo. Al igual que el currículum, la evaluación juega como una bisagra
entre lo que Lundgren (1992: 71 y siguientes) llama “funciones internas” y “funciones externas” de
la educación. Al menos la necesidad de evaluar coloca sobre la mesa la necesidad de clarificar esas
relaciones. En la determinación de propósitos y en la especificación de criterios descansa la
posibilidad de que la evaluación educativa, que es siempre un medio de control del proceso,
pueda, ella misma, ser evaluada y sometida a juicio por los distintos actores. Por eso, la definición
de las prácticas evaluativas coopera en el proceso conjunto de definición de las intenciones
educativas. Ellas también expresan parte de lo que es valorado y jerarquizado en los aprendizajes.
Y, en esa medida, deberían reflejar algunos de los propósitos importantes de un curso o de un
programa de trabajo. No es fácil que expresen todo. No es tan sencillo sostener esa pretensión de
totalidad en un instrumento de enseñanza. Esto en parte se debe a que, como fue dicho, los
propósitos de las evaluaciones formalizadas (por ejemplo las que se toman con el objeto de
calificar a los estudiantes) no cubren todos los propósitos de un curso. Lo que sí puede esperarse
de ellas es que cubran aspectos sustantivos, que se relacionen con el proceso de enseñanza, que
atiendan a las reales oportunidades de aprendizaje y que expresen los requisitos para los
recorridos futuros de los alumnos cuando ello sea necesario. El tipo de decisiones que deba
tomarse en cada caso será, probablemente, parte de un debate práctico que reúna estas
dimensiones. Como ya se dijo, toda evaluación implica juicio y estos siempre son valoraciones
prácticas que se realizan de manera fundada mediante deliberación.

La Evaluación - Capítulo Feldman

Cargado por

Copyright:

Formatos disponibles

La Evaluación - Capítulo Feldman

Cargado por

Información del documento

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

La Evaluación - Capítulo Feldman

Cargado por

Copyright:

Formatos disponibles

Daniel Feldman. Aportes para el desarrollo curricular. Didáctica General.

Ministerio de Educación de la Nación. Año 2010

La evaluación como parte de las acciones de enseñanza

La evaluación es un tema delicado porque expresa el ejercicio de la autoridad de la escuela y del

Tipos funcionales de evaluación

Básicamente, se utiliza la evaluación en el cumplimiento de las siguientes funciones: Formativa:

De los tipos funcionales de evaluación, la evaluación formativa es la que se encuentra más

La función reguladora de la evaluación formativa puede cumplirse si se complementa con una

Al final, ¿a qué se llama “evaluar”?

Los instrumentos para obtener información

Los criterios para valorar

La calificación, entonces, es una expresión limitada de un rendimiento educativo. Sin embargo

Posibles sesgos en la ponderación de la información

Se constataron una cantidad de efectos sistemáticos que influyen o sesgan la ponderación de la

¿Qué hacer con la evaluación?

También podría gustarte