Zavala Ana Evaluacion Rev. Voces. Feb.2004
Zavala Ana Evaluacion Rev. Voces. Feb.2004
Zavala Ana Evaluacion Rev. Voces. Feb.2004
1
los estudiantes (esos que no se tenía ni la menor duda que constituían la consecuencia
de la enseñanza de los maestros y profesores). Y sin darse bien cuenta cómo, la eva-
luación de los aprendizajes estaba –de rebote- evaluando la enseñanza. Los culpables
del desastre estaban a punto de ser descubiertos, y salvados de la perdición si desde la
propia evaluación se lograba encontrar dónde había fallado la enseñanza... Las clases y
los libros sobre evaluación se llenaron de términos científicos como validez y confiabili-
dad, instrumentos y objetivos. La evaluación pasó a ser diagnóstica, sumativa o for-
mativa, cuantitativa o cualitativa, y muchas cosas más mientras el juego a dos puntas
se instalaba como un axioma: un mal resultado en la evaluación es el testimonio de
una mala enseñanza.
Dada la natural complejidad del asunto, su alto standard técnico y la sofisticada ela-
boración de los más perfectos y fiables instrumentos de evaluación, ya no fue posible
que eso quedara en manos de los simples enseñantes. Aparecieron pues, las pruebas
estandarizadas, las pruebas nacionales, regionales, continentales, transcontinentales y
mundiales, ideadas, diseñadas, elaboradas y aplicadas por los verdaderos expertos en
la materia (una materia que había dejado de ser educativa hace mucho pero mucho
tiempo, para ser en su lugar la razón de ser de la burocracia académica nacional o in-
ternacional).
Afortunadamente, y aunque no haya comúnmente muchas palabras para decirlo en
público, los profesores sabemos sobradamente que del dicho al hecho hay un largo
trecho. En otras palabras, no más que vástagos de mentes ociosas, en una buena ver-
sión. Lo que los profesores hacemos cuando evaluamos, dista un poco de toda esta
„teoría‟ que en realidad no es tal.
2
los con más propiedad en un discurso ideológico y de ejercicio del poder al amparo de
una apariencia científica legitimadora.
Por otra parte y sin demasiada maldad, hay que ser bastante ingenuo para conside-
rar medibles a bienes simbólicos como el saber representado en el aprendizaje. No es
cuestión de evaluación educativa, sino de naturaleza de las cosas, el hecho de que ni
la belleza, ni el poder, ni el hambre, ni la tristeza, ni el amor, ni el odio puedan ser
medidos de la misma manera que la longitud, la temperatura, el tiempo o el volumen.
Está claro que la pretensión de medir algo para lo cual no se tiene ni instrumento de
medida ni unidad de medida es un poco insensata, no obstante lo cual hay gente que
pretende la posibilidad cierta incrementar los rendimientos de los estudiantes en un
20% a lo largo del próximo quinquenio, de la misma manera que Toyota puede pre-
tender incrementar la producción de automóviles en un 20% a lo largo del próximo
quinquenio...
Finalmente, una pequeña consideración respecto de la naturaleza del objeto evalua-
do. Está claro que no es lo mismo decir los aprendizajes que los desempeños de los
estudiantes. El aprendizaje es un proceso, posiblemente más largo y más complejo
cuanto más se trata de dimensiones cognitivas y epistemológicas complejas y abstrac-
tas. Los efectos de ese aprendizaje –posiblemente aún en proceso- sobre las acciones
escolares de los estudiantes dista mucho de ser mecánico, en el sentido de que el que
lo tiene lo muestra y lo demuestra como la cosa más natural del mundo. La relación
endemoniada entre lo que los estudiantes saben, lo que creen que tienen que decir, lo
que creen que les fue preguntado y lo que creen que les conviene hacer a los efectos
de producir algún efecto en sus calificaciones o en sus pares o en sus padres, supera
cualquier cálculo estandarizado. Sus desempeños, es decir lo único visible y asible a los
ojos de un evaluador, son en realidad el resultado de la singular combinación que cada
uno de ellos hace de los factores anteriormente anotados. Por lo tanto, una debilidad
más a la cuenta de esta construcción con pretensiones teóricas respecto de la evalua-
ción de los desempeños escolares –y no de los aprendizajes- de los estudiantes.
De todas formas, el poder se mueve en círculos autocomplacientes. Esto quiere decir
que la teoría de la medición de los aprendizajes habidos como consecuencia de la en-
señanza de los profesores, y por lo tanto de la consecuente medición implícita de la
eficacia de los profesores al enseñar a los alumnos, va a seguir circulando por el mun-
do por mucho tiempo. Vamos a seguir viendo reglamentos de evaluación, talleres de
coordinación/normalización de criterios „coherentes‟ de evaluación, y por supuesto or-
dalías evaluatorias de todo nivel, desde pruebas nacionales hasta transcontinentales.
De hecho, una teoría de la evaluación de los desempeños escolares no puede estar
impuesta por un discurso, aún si el mismo puede ostentar algún grado de validez
empírica, entendiendo empírico por un tipo de relación con el objeto distinto del que
rige para las relaciones teoría-práctica (de la evaluación por ejemplo). La academia
tiene todavía una buena asignatura pendiente con esto de la evaluación, que es a es-
tas alturas como un complejo de nacimiento. Hasta tal punto ha quedado instalado en
la mente de los académicos (y también de muchos profesores) la idea de que las
prácticas educativas „aplican‟ algunas teorías producidas en los ámbitos específicos de
producción de teorías formales (es decir en la academia), que la idea de alguien distin-
to y normalmente considerado inferior como un maestro de escuela o un profesor de
liceo puede producir algo reconocido como teoría, resulta francamente inaceptable y
repugnante.
Los abordajes en realidad metateóricos y especulativos propios de la Academia en
materia de evaluación son todavía un camino muy tímidamente recorrido. Los audaces
caminantes son aquellos cuya línea de trabajo los ha llevado por la comprensión de las
acciones educativas como prácticas, y por lo tanto sustentadas en teorías de la práctica
3
(o de la acción) cuya relación con las producciones académicas es bien distinta de la
mera y mecánica aplicación. Naturalmente, no forman parte de la parte de la Academia
que se relaciona más fluidamente con los círculos de poder educativo, sea en la admi-
nistración o sea en el gobierno de los sistemas educativos.
4
yando‟... Naturalmente ese sentido depende del contexto. No es lo mismo primer año
que sexto, un liceo céntrico o privado que uno marginal, no es lo mismo un buen estu-
diante que uno malo... „Para ser Fulano, no está mal...‟
Lo que en realidad sucede, es que en este asunto hay más de un actor en la lista
del reparto. Así como los profesores actúan como actores, autores y agentes de sus
acciones de enseñanza (y por eso es necesaria una teoría de la acción para poner en
claro lo que está pasando), los alumnos también son actores, autores y agentes de sus
acciones, incluyendo estudiar o no, levantar la mano, intervenir en clase y participar en
los trabajos destinados a la evaluación. Así como los profesores pueden elegir entre
enseñar y dar la clase, los alumnos normalmente entienden de manera diversa el
aprender (algo generalmente utópico si no conlleva algún fin práctico concreto) y sal-
var (generalmente sin importar demasiado la cuestión de la naturaleza de los medios
por los cuales los fines se alcancen...). La evaluación en definitiva es la producción de
un texto acerca de otro texto, siendo ambos textos simultáneamente acciones en sí
mismos, el del profesor y el del alumno. Más allá de que puedan dar cuenta teórica-
mente de la naturaleza de la cuestión, para algunos profesores el agente (alumno) y la
acción (por ejemplo „escrito mensual‟) están hasta tal punto consubstanciados, que
difícilmente pueden trazar una línea entre la buena o mala persona que su alumno es y
el buen o mal trabajo que ha realizado. A veces esta indefinición se extiende hasta los
contextos sociales o familiares en los cuales los alumnos viven, de manera que lejos de
constituir –el escrito, por ejemplo- un texto expresando las carencias socio-económicas
y culturales de su identidad, la imprecisión teórica y metateórica respecto de la cues-
tión hace que el texto de la evaluación acabe constituyendo un promedio ponderado y
compensatorio de todos los males que pueden ser relacionados con el agente de la ac-
ción „escrito de Historia‟, por ejemplo. Las complejas e inevitables relaciones entre el
sujeto de la acción y la acción, y entre el sujeto y los textos que son efectos de la ac-
ción, como los escritos, los orales, los deberes, etc., no son como la plasticina gris, una
amalgama indeterminada y mecánica de todos los componentes.
¿Qué es lo evaluado, entonces? ¿Ya no es más el conocimiento (aprendido o mos-
trado o...)? Naturalmente que lo que media entre profesores y alumnos en una rela-
ción educativa es el conocimiento que los profesores enseñan con la intención de que
los alumnos conozcan, disfruten, manipulen circunstancialmente, y si pueden, también
aprendan (aunque sea por un tiempito). La evaluación se apoya naturalmente sobre
producciones orales o escritas (o aún gráficas o corporales) referidas a conocimientos
enseñados en la clase. Lo que posiblemente no esté tan claro, es que esas produccio-
nes de los estudiantes son acciones intencionales de agentes lúcidos portadoras de to-
da la carga contextual que define identitariamente a los sujetos de la acción. Esto no
quiere decir ni remotamente que „porque X hizo un mal trabajo, entonces el sujeto de
la acción que es X, es igualmente malo‟. Tampoco quiere decir que „ya no importa cuán
malo es el trabajo de X, porque en realidad nunca vamos a saber bien que es lo que
sabe y lo que ignora‟. Lo que en realidad quiere decir es que „entender y valorar el tra-
bajo de X es tan complejo como comprender el iceberg por la puntita que queda fuera
del agua‟.
Finalmente, que lo evaluado constituya la producción de un sujeto de acción, no
quiere decir que la noción de error se diluya, como mucha gente piensa. Si alguien es-
cribe o dice que la Batalla de las Piedras sucedió el 19 de junio, eso está mal. Las ra-
zones por las cuales el sujeto se haya equivocado no mejoran o hacen desaparecer el
error, ni la necesidad de señalarlo. Las circunstancias por las cuales un sujeto puede
cometer un error son muy diversas, así como las circunstancias en las que puede acer-
tar sin saber. Si alguien escribe o dice que la Batalla de las Piedras sucedió el 18 de
mayo, está bien y no hay necesidad de remarcarlo. Sin embargo, las condiciones de
5
producción de ese pequeño texto pueden ser tan variadas, que en general uno prefiere
no pensar. ¿Copió? ¿Embocó? ¿Dedujo exitosamente? ¿Apostó a una corazonada?
¿Podrá el error ser una deducción infeliz, tan solo errada en alguno de sus pasos, sien-
do los demás correctos? Si certeza y acierto no son la misma cosa ¿cómo diferenciar-
los? Y si después de la corrección del escrito X entendió finalmente y para siempre el
tema, ¿qué hago con esa nota que responde a una realidad que ya no es? ¿Para qué
sirven los testimonios de cuando no sabías hacer las cosas? ¿Será por lo de la evalua-
ción de procesos...?
La búsqueda de una teoría de la evaluación nos lleva pues, por los caminos de la
teoría de la acción, en tanto la evaluación es una acción y en tanto lo que se evalúa
también es una acción. La compleja relación entre acciones y textos, tanto para la ac-
ción de evaluar como para la acción de dar cuenta de los conocimientos o habilidades
que se poseen, constituye en último término lo más asible que tenemos para com-
prender todas las acciones y producciones implicadas en la evaluación escolar.
6
Cuando los alumnos entregan sus trabajos al profesor en el contexto de una rela-
ción educativa formal e institucionalizada, como lo es el liceo o la escuela por ejemplo,
expresan a través de ellos su percepción de esa relación. Una hoja en blanco, puede
ser una expresión de respeto (por el profesor o por sí mismo), un montón de dispara-
tes puede ser una expresión de desprecio (por el profesor, por la asignatura, por la
institución educativa, aunque no necesariamente por sí mismo) o de rebeldía, o de in-
diferencia... Bien mirada, la producción de los estudiantes expresa indudablemente el
sesgo afectivo de la relación, es decir, la indiferencia, el odio, el placer, la rabia, la
sensación de indefensión, la rebeldía contra la imposición o la arbitrariedad, etc. Todos
sabemos que no solo hay profesores que manejan distintas perspectivas sobre las ta-
reas de los estudiantes, y los estudiantes lo saben antes que nadie, sino que también
hay profesores frente a los cuales los estudiantes prefieren cualquier cosa antes que su
desaprobación o su desprecio. Hay grupos de alumnos que estudian para una materia
y no para otra, y posiblemente no por razón de los contenidos de la materia. La rela-
ción entre profesores y alumnos cuenta en materia educativa, y mucho más en materia
de evaluación. Así como los alumnos producen de acuerdo a como viven la relación
educativa, los profesores también evalúan a la interna de esa relación, grupal e indivi-
dualmente hablando. Está totalmente claro que para muchos adalides de la evaluación
perfecta y objetiva estas afirmaciones son de una transgresividad inconcebible. No
puede ser que la evaluación funcione así, tan interpersonalmente, tan intersubjetiva-
mente, tan „afectivamente‟. La pregunta es, sin embargo, ¿cómo es posible que las co-
sas funcionaran objetivamente a la interna de una relación intersubjetiva, mediada por
el poder y el afecto?
La construcción de los textos sobre los que la evaluación se asienta es parte de la
acción de sujetos, cuyas autobiografías y sus dimensiones identitarias no pueden no
expresarse tanto en la acción como en los textos que dicen la acción o son efecto de
ella. La autobiografía educativa del evaluador es una pieza clave en la comprensión de
la acción „evaluar‟. El gusto y el respeto por la asignatura, así como posiblemente sus
propias experiencias como evaluado „exigentemente‟ o „bonachonamente‟ son compo-
nentes esenciales que entran en juego en el momento de apreciar (evaluar) los traba-
jos de sus alumnos. La idea de que en realidad los profesores nos vemos a nosotros
mismos en nuestros alumnos (mientras que ellos ven a sus padres en nosotros) viene
a agregar un granito más de complejidad a la trama interpersonal de la evaluación. De
alguna manera estas trazas identitarias subyacen a la acción de evaluar en forma de
„motivos‟ o razones por las cuales uno hace lo que hace de la forma en que lo hace.
Nada en materia de acción (educativa, evaluativa, o lo que sea) empezó ayer de tarde.
Entender a un profesor exigente es mucho más que escuchar una docena de argumen-
tos a favor de la exigencia. Lo mismo para entender a esos que nunca mandan a nadie
a examen, o esos que al final siempre terminan conformándose con lo que hay.
Finalmente, el juego de los afectos y el poder sitúa las cosas en el plano de la se-
ducción. Pocas cosas más difíciles de tematizar en referencia a las relaciones educati-
vas, teniendo en cuenta especialmente la espesa borra del discurso tecnológico, efi-
cientista, objetivista e impersonalista que lleva ya varias décadas ocupando los espa-
cios de discusión, pensamiento y producción académica. Sin embargo, la huella de la
seducción (en el haber o en el debe de su concreción) aparece con mucha facilidad en
la producción de los alumnos (que por ejemplo encuentran un „motivo‟ para participar
lo mejor posible en el juego educativo) y con más discreción en la confirmación si-
multánea del afecto y la autoridad por parte de los profesores. La seducción pues, es
la madre no tan racional y no tan rápidamente confesable de „otros‟ trabajos y también
de „otras‟ notas.
7
Los apoyos de la producción del texto II:
criterio, intencionalidad y referente
La valoración de cualquier producción estudiantil pasa por el cotejo entre ella y un
referente, construido, detentado y ostentado por el evaluador. Este referente está
compuesto por los conocimientos, acciones, operaciones, etc., que el estudiante deber-
ía incluir en su trabajo. La calificación es en cierta forma proporcional al parecido del
trabajo del estudiante con ese referente. Desde este punto de vista, la idea de medir,
en el sentido amplio de „comparar‟ con algo que se toma como referencia, podría ter-
minar siendo pertinente para la evaluación. Sin embargo, la similitud acaba rápido, de-
bido a que las mediciones convencionales no dependen del uso de un criterio u otro.
La medida de la longitud, o del peso, o del no tiene más que una forma de hacerse, en
función de los instrumentos de medida. En materia de evaluación, la mediación de un
criterio u otro, y por lo tanto no estable y no mecánico para el cotejo entre la produc-
ción y el referente aleja bastante la idea de medición en sentido estricto. Por otra par-
te, la construcción del referente es una potestad del evaluador, cosa que en las medi-
ciones convencionales, como las magnitudes físicas, no sucede.
En general la tamatización de estas cuestiones conlleva la idea de que entonces to-
do vale en evaluación, que el error es cualquier cosa, y que en materia de evaluación,
por fin, todo vale. Que se comprendan los mecanismos interpersonales que subyacen a
la evaluación o la circulación del poder entre sus actores, no significa ni remotamente
la necesaria ausencia de rigor. La idea de que el rigor es primo de la objetividad, y la
subjetividad es prima del „a piacere‟, no se sostiene. Aún así forma parte de las creen-
cias populares más arraigadas acerca de la cuestión.
La idea de que los referentes en evaluación son fijos y estables y están ligados a la
verdad y a la falsedad, es tan solo una parte de la cuestión. Naturalmente dos más dos
es cuatro, un siglo tiene cien años, la Batalla de las Piedras fue el 18 de mayo, etc., y
no es atribución del constructor del referente alterar fechas históricas o cuestiones
aritméticas. Sobre todo en trabajos de cierta complejidad, el referente marca una ruta
para llegar a la información correcta, o a la operación correcta, o a la estrategia correc-
ta, de forma que es algo bastante más complejo que información correcta o incorrecta.
Todos los profesores sabemos –por ejemplo- que algunas veces los alumnos contes-
tan preguntas que no les fueron formuladas, y que por lo tanto no hay ni pregunta ni
referente reales para contrastar esa respuesta. Una máquina pondría automáticamente
la nota mínima de la escala o „sin responder‟, en la medida en que encontraría un refe-
rente y una respuesta sin ninguna coincidencia. Cuando un profesor procede –todo lo
fundamentadamente que pude- de esta manera, decimos que adopta un criterio rigu-
roso. Pero como no se trata de máquinas, sino de situaciones interpersonales, y me-
diadas por el poder, situaciones como ésta demandan del profesor una decisión que
naturalmente está instalada en el plano de lo ético. Como todo lo ético, esta situación
está tironeada por dos soluciones posibles, aunque diferentes y antagónicas. Se tome
la decisión que se tome, siempre cabrá la duda de si se habrá hecho lo correcto. La
existencia de un componente criterio sitúa pues, a la evaluación en el plano de lo ético.
La decisión a tomar implica o bien descalificar la respuesta (criterio riguroso), o bien
inventarle una pregunta y un referente ad hoc y calificarla en función de esa nueva
situación (criterio flexible). De todas formas, aún queda por decidir si la nueva pregun-
ta tiene el mismo status, y por lo tanto podrá generar el mismo valor respecto de la
producción del estudiante. En otras palabras, si admitir que algo sabe y que estudió
vale lo mismo si eso le es preguntado que si lo dice por su propia iniciativa. Esto insta-
la una nueva duda, en el caso de que la nueva pregunta tenga el mismo status de la
no contestada, solo que sobre diferente campo de información (la hoja o el tallo, la
llanura o la montaña, los Incas o los Mayas, etc.). La infinita gama de decisiones –
8
entre el máximo rigor y la flexibilidad total- a las que lleva el juego entre producciones
y referentes, sobre consignas reales o aportadas ad hoc para validar las respuestas de
los estudiantes, constituye uno de los pilares más complejos de la comprensión de la
acción „evaluar‟.
La percepción respecto de la diversidad de criterios es universal y a simple vista.
Existe, sin embargo, la utopía de la unificación de criterios como una forma de „mejo-
rar‟ la práctica de la evaluación. Hay que irse resignando a pensar que el criterio no es
una pieza gastada en un engranaje, y que con reponerla el problema estará soluciona-
da. Antes que nada, la diversidad de criterios no es un problema bajo ninguna conside-
ración. Está en la naturaleza misma de la acción de evaluar, en tanto constituye uno de
los componentes sobre los cuales se apoya la producción del texto respecto del objeto
evaluado. Como todas las partes de la acción „evaluar‟, el criterio transparenta a la per-
sona que lo está aplicando. Normalmente los criterios están fundados en las nociones
de racionalidad y justicia que los profesores tienen integrados, y aparecen intrínseca-
mente ligados a la producción de efectos ulteriores respecto de la acción evaluar.
La intencionalidad no es ajena a la evaluación, como no le ajena a cualquier acción
vinculada a la enseñanza. La decisión por una calificación mayor o menor, suficiente o
insuficiente, en general intenta ser un mensaje cifrado para el alumno. „Se aprecia tu
trabajo (aunque no contestaste lo que preguntaba)‟, „no pienses que me vas a pasar‟,
„aunque hiciste un esfuerzo castigo tu deshonestidad, a ver si aprendés a no copiar‟,
„no podía ser mejor, estoy muy contento‟, „estás a mitad de camino, dale seguí estu-
diando si querés más nota‟, etc. Todos tenemos claro que, derecho de interpretación
del lector, muchas veces los mensajes recibidos se decodifican con otro código y aca-
ban diciendo „no te preocupes, hacé cualquier cosa que al final salvás‟, „mirá que aquí
tienen en cuenta lo de las dificultades, así que no te mates demasiado‟, „qué tacañería!
con lo que estudié! no le alcanza con nada...‟, „este se la agarró conmigo, nunca la voy
a subir‟, „esta vez me pescó copiando, pero...‟
De todas formas, más allá de la incertidumbre respecto de la interpretación de los
mensajes, lo esencial es que existe un componente de intencionalidad directamente
ligado con la elección de un criterio para valorar el trabajo de los estudiantes. La califi-
cación implica doblemente una apreciación del trabajo y la expectativa de producir un
efecto no meramente informativo sobre el autor. En realidad, todos los textos lo hacen,
y más estos que están encerrados en el contexto de una relación interpersonal, afecti-
va y mediada por el poder.
De alguna manera los criterios, los referentes y las intencionalidades de la evalua-
ción remiten inevitablemente a las dimensiones interpersonales e intersubjetivas de la
relación educativa. La comprensión profunda de esta práctica está por lo tanto atrave-
sada por todos estos componentes, que sin embargo no derivan ni en su cambio nece-
sariamente ni en su esquematización simple y preceptiva, como algunas cabezas tec-
nológicas soñarían.
9
más que nada una cuestión de entendimiento social. Por fuera de eso generalmente
queda la opción miserable de aceptar que uno hace las cosas como Dios le dio a en-
tender, de una forma totalmente amateur. Bien leído esto equivale la mayor parte de
las veces a suponer que no han de estar muy bien hechas, y que por lo tanto habría
que ver bien con un experto cómo es eso de evaluar objetiva y perfectamente los tra-
bajos de los estudiantes. La fantasía de que existe una y solo una manera posible de
evaluar correctamente es una especie de correlato de El Dorado, o del último canto de
la Divina Comedia. Nadie la practica ni la conoce, pero se la puede pensar como posi-
ble y deseable.
El mundo real de la evaluación es otra cosa, y funciona de formas muy variadas. Es-
to no quiere decir sin embargo que por comprensibles estas formas puedan ser todas
defendibles. Eso, hay que verlo. Lo importante es llegar a verlo, llegar a entender to-
das las formas en que la evaluación se pone en práctica y poder dar cuenta de ellas.
Este no es todavía un terreno de cambios ni de mejoras visibles. Es tan solo la condi-
ción para intentar cambios que sean racionalmente justificables y defendibles, porque
en algún lugar las prácticas de evaluación o no se entienden o no se pueden defender.
La cuestión no es por lo tanto „¿cómo lo tengo que hacer para hacerlo bien o mejor
de lo que lo hago?, sino más bien „¿cómo, por qué y para qué hago lo que hago cuan-
do evalúo?‟, que es un buen principio.
Bibliografía
10