Paradigmas y Modelos de La Evaluación Educativa
Paradigmas y Modelos de La Evaluación Educativa
Paradigmas y Modelos de La Evaluación Educativa
1. Introducción
2. Paradigma cualitativo y paradigma cuantitativo en educación:
repercusiones en la evaluación educativa.
3. Modelos y enfoques de la evaluación.
4. Diseños de evaluación educativa.
1.1. INTRODUCCIÓN
La evaluación es un concepto de gran relevancia en el mundo educativo. Muchas son las páginas
que se han escrito o se han dicho para tratar este tema. Afortunadamente, en este momento nos
encontramos con muchísimas referencias válidas, sin embargo también es preciso advertir que
hemos de ser críticos y consecuentes ante tanta información.
Son muchos los subconceptos derivados del primero y también muy variados los enfoques bajo los
cuales la evaluación puede ser estudiada y aplicada. Los trabajos que podemos encontrar en las
obras de Tenbrink, Gimeno y Pérez, Stufflebeam, Shinkfield, Tyler, Escriven, Rippey, Stake u otros
a los que a lo largo de estas páginas hagamos referencia, nos ofrecen unas perspectivas no siempre
coincidentes, si bien, en muchos casos, pueden considerarse complementarias.
Si el campo conceptual se nos presenta bastante abigarrado, todo aquello referido a técnicas e
instrumentos de evaluación puede parecernos o presentarse igualmente amplio, heterogéneo,
confuso e inconexo.
En el plano educativo, los temas son aquellos que afectan a los alumnos, a los profesores, a los
programas, a la organización, a los procesos de enseñanza, a los resultados... y a la propia
evaluación, porque también es necesario evaluarla.
Evaluar es asignar un valor a algo, juzgar. De entre las muchas definiciones que existen de
evaluación, vamos a resaltar la que formula Tenbrink (1981, pág.19):
Las decisiones educativas se toman sobre la base de unos juicios, y los juicios, a su vez, se emiten
sobre la base de una información. La interdependencia de estos tres conceptos (decisiones, juicios,
información) define esencialmente la evaluación.
Cuando evaluamos estamos realizando tanto una medición (obtención de información) como una
valoración (emisión de un juicio). Una y otra dimensión cumplen funciones diferentes en el proceso
total de evaluación. A través de la medición constatamos el estado actual del objeto o situación que
queremos evaluar. A través de la valoración realizamos una comparación entre los datos obtenidos
en la medición que reflejan el «cómo es» el aspecto a evaluar y unos determinados parámetros de
referencia que reflejan bien el «cómo era» o el «cómo debería ser» dicho aspecto. Una y otra
dimensión son necesarias para que exista una buena evaluación. Sin la valoración quedaría reducida
a una simple medida descontextualizada. Sin medición, la sola valoración da pie a una opinión
subjetiva, no a una evaluación.
Pero, el objetivo último, la razón de ser del juicio es la de tomar decisiones que mejoren el proceso
de enseñanza-aprendizaje.
Para concluir, diremos esquemáticamente que esta forma de entender la evaluación implica cuatro
tareas básicas:
Siendo la evaluación un elemento básico en cualquier tipo de actividad educativa, es preciso señalar
que ésta se encuentra sometida a la misma polémica sobre su estatus científico a la que se haya
sometida la propia didáctica (entendida ésta como la ciencia de la enseñanza y el aprendizaje).
En la actualidad existen, en los estudios sobre la didáctica, dos posiciones, en cierta medida
encontradas, que parten de presupuestos teóricos distintos y que, de esta manera, tienen puntos de
vista distintos acerca de cómo deben resolverse los problemas que se plantean en los contextos
educativos.
De forma resumida, podemos hablar de la existencia de dos corrientes o paradigmas que se conocen
con el nombre de paradigma cuantitativo (formado por aquellos investigadores que consideran que
la didáctica debe ser una ciencia hipotético deductiva, que base la elaboración de sus teorías y la
resolución de los problemas a los que se enfrenta, en el método experimental) y paradigma
cualitativo (formado por aquellos científicos que piensan que el método experimental no ha sido
capaz hasta la fecha de resolver los problemas que se plantea la educación, fundamentalmente
debido a la singularidad de los mismos, lo que impide la formulación de leyes universalmente
válidas; lo cual invita a la utilización alternativa de métodos cualitativos que permitan la
interpretación y la comprensión de lo que ocurre en el contexto singular en el que surgen los
problemas).
1) EL PARADIGMA CUANTITATIVO
Como señala Casanova (1992), en principio, cabría preguntarse a qué nos referimos cuando
empleamos el término paradigma. Tal y como lo definió Kuhn en 1962, "un paradigma es un
conjunto de suposiciones interrelacionadas respecto al mundo social, que proporciona un marco
filosófico para el estudio organizado de este mundo". Por tanto, es un marco de referencia para las
generalizaciones, los valores, las creencias, normas y actitudes ante la vida y el conocimiento de
cada individuo y de los diferentes grupos sociales.
A lo largo de la historia se han ido configurando dos posiciones filosóficas ante la ciencia, cuyo
enfrentamiento ha tenido, y para algunos tiene todavía, un carácter paradigmático. Estas
concepciones de la ciencia han venido adoptando distintas denominaciones: idealismo/realismo,
neopositivismo/relativismo, etc., aunque en el campo de las ciencias humanas y sociales se ha
extendido el uso de los términos paradigma cuantitativo/cualitativo, quizá por la identificación con
los procedimientos e instrumentos utilizados.
Para adentrarnos en las bases teóricas epistemológicas que sustentan estas dos líneas de
pensamiento, es necesario que comencemos señalando lo que se entiende por ciencia.
Desde una perspectiva estrictamente cientifista se podría señalar que la única verdad que existe es la
generada por la ciencia positiva.
El proceso de obtención de nueva información a través del método experimental debe presentar dos
características esenciales, a saber: en primer lugar, el experimento su pone crear una situación
artificial totalmente controlada, en la que se hace una prueba y se obtienen unos resultados que
pueden ser interpretados de manera precisa y objetiva; en segundo lugar, el método experimental
pretende detectar relaciones causales entre las variables estudiadas (variable independiente y
variable dependiente). Esto último se apoya en la suposición de que si en una situación se
mantienen todas las condiciones constantes, menos una (que varía de forma controlada), las
consecuencias que se produzcan hay que achacarlas exclusivamente a aquello que se varió. Como
síntesis, podemos definir un experimento como una situación controlada, en la que se trata de
detectar las relaciones causales entre algunos eventos.
Desde la publicación en el siglo XVI de la obra de Comenio "Didáctica Magna" hasta nuestros días,
las Ciencias de la Educación han pretendido buscar leyes universalmente válidas que trataran de dar
solución a los problemas generados en los contextos de enseñanza-aprendizaje. De esta manera, la
didáctica como ciencia experimental ha pretendido la elaboración de un cuerpo sólido de
conocimientos teóricos que permita actuar, como si de un vademécum se tratara, de forma que a
cada situación problemática diagnosticada le siguiera un tratamiento preciso y adecuado (a esta
forma de proceder se le denomina enfoque tecnológico).
Las características que definen este enfoque pueden resumirse, en principio, en los siguientes
presupuestos:
Sin embargo, la utilización del enfoque tecnológico, derivado en primera instancia de considerar
que el único conocimiento posible es el obtenido a través de metodología experimental, presenta
algunos inconvenientes que hacen necesario un replanteamiento de los presupuestos científicos y
prácticos que han sustentado hasta ahora la Didáctica como ciencia de la enseñanza-aprendizaje.
Algunos de los principales inconvenientes que surgen a la hora de aplicar la metodología
experimental para resolver los problemas de la educación son los siguientes:
Por otro lado también hay que señalar que el enfoque tecnológico no sólo genera dificultades en la
investigación educativa, sino que también se ha deja sentir en otros aspectos de la práctica
evaluadora habitual como son las calificaciones escolares. El enfoque tecnológico, experimental,
aboga por la utilización del número como referencia objetiva en las calificaciones escolares. Sin
embargo, la utilización indiscriminada de calificaciones numéricas genera algunas dificultades
señaladas, entre otros, por Casanova (1997).
Es imposible expresar con una cifra la riqueza de información que se puede tener acerca de la
formación de un alumno o alumna en todas las facetas de la personalidad que se van desarrollando
durante su proceso educativo.
Señalaremos ahora algunos ejemplos que pretenden ilustrar que la utilización del número en las
calificaciones no garantiza la pretendida objetividad que persigue con su uso:
1er Ejemplo:
Todos tenemos constancia de que un mismo ejercicio puede obtener calificaciones distintas en
función de quién lo haya corregido. Es ya una práctica adoptada habitualmente, que en los
exámenes de oposiciones se descarten las puntuaciones que presentan una diferencia mayor de tres
puntos. Igualmente, el mismo profesor valora más o menos un trabajo según el nivel general del
grupo -evaluación normativa-, como ya comentamos en su momento.
¿Por qué se producen estas situaciones? Porque si valora únicamente un evaluador, sin referencias
externas -criterios- y rigurosas para ello, lo hará siempre:
Si llega un alumno nuevo a un grupo y la información que aporta sobre sus aprendizajes es un
boletín donde aparece: Lengua y Literatura: 6 (o Bien, es indiferente). Matemáticas: 5 (o
Suficiente), etc., el profesor que debe comenzar a trabajar con él no sabe en absoluto qué aspectos
del área domina ese alumno y en cuáles necesita reforzar sus aprendizajes. Puede interpretarse que,
en función de la programación del profesor precedente, el alumno había alcanzado lo básico para
continuar sin graves dificultades. Pero, primeramente, la programación de ese profesor no tiene por
qué coincidir con la del actual (más aún con un sistema educativo que acepta la flexibilidad y
apertura del currículo y, por lo tanto, diferentes secuenciaciones de objetivos y contenidos); en
segundo lugar, el alumno ha alcanzado unos aprendizajes básicos y le quedan por dominar otros
tantos (del 5 al 10 hay un amplio margen de aprendizaje), que no se sabe cuáles son; en tercer lugar,
en esa evaluación escueta habrán incidido numerosos factores personales -salvo que se nos aclare lo
contrario-, según venimos comentando, que no es posible conocer para encuadrar adecuadamente la
información que se recibe del alumno. En síntesis: con una calificación no descriptiva, un
profesional no conoce la situación de aprendizaje del estudiante evaluado. Debe, por tanto,
comenzar por realizar una amplia y profunda evaluación inicial de las diferentes facetas del área,
para determinar qué es lo que domina y dónde necesita reforzar y ampliar sus aprendizajes.
Nos encontraríamos en una situación similar en los casos en que un alumno precisa de medidas
especiales de adaptación o diversificación curricular o simples refuerzos educativos para algunas
facetas de su aprendizaje. Estas medidas hay que tomarlas sobre datos concretos, claros, bien
descritos..., porque hay que elaborar un programa individualizado para el estudiante. Con la
evaluación expresada numéricamente seria imposible realizar ese programa de manera que se
produjera la regulación de su proceso de enseñanza y aprendizaje para que superara los fallos
específicos en su formación.
Se plantea un problema añadido en la situación social y educativa del momento actual. Tal y como
se ha promulgado en los decretos de currículo en nuestro país, aparecen contenidos relacionados
con actitudes, valores y normas que se deben enseñar, que los alumnos deben aprender y que, por lo
tanto, también se deben evaluar. Si ya es incomprensible un "7" en el área de Lengua y Literatura,
resultaría grotesco afirmar que un alumno ha obtenido un "7" en solidaridad, sinceridad, respeto a
las ideas de los demás, etc.
3er Ejemplo
Parece incuestionable que la evaluación de procesos hace necesario un modelo de evaluación más
amplio, más comprensivo, que extienda sus técnicas y sus instrumentos de valoración y que,
además, exprese sus resultados mediante la descripción explícita de lo que se ha alcanzado y lo que
está pendiente, y de las causas de un rendimiento concreto o las dificultades que presenta el alumno
evaluado.
Estos y otros inconvenientes han llevado a los estudiosos de la educación a la necesidad de utilizar
un concepto de ciencia más amplio y unos métodos de investigación y evaluación más adecuados a
los contextos en los que surgen los problemas. El conjunto de métodos alternativos a la utilización
en educación de la metodología experimental-cuantitativa, se denomina investigación cualitativa.
2) EL PARADIGMA CUALITATIVO
Desde la década de los sesenta se ha producido un rápido y acelerado incremento del interés sobre
la perspectiva llamada evaluación cualitativa (Eisner, Cronbach, McDonald, Stenhouse, House,
Guba, Parlett, Hamilton, Elliot, Stake...). Tal interés se debe en gran medida al reconocimiento de
que los tests estandarizados de rendimiento no proporcionan toda la información que se precisa para
comprender lo que los profesores enseñan y los alumnos aprenden.
De forma breve podrían considerarse las siguientes características como las definitorias del
paradigma alternativo:
El único procedimiento que puede proporcionar Existe un conjunto heterogéneo de métodos que tiene como
objetividad y rigor es el método hipotético deductivo o objetivo comprender los fenómenos educativos tratando de
método científico. interpretar las opiniones de los agentes implicados en los
procesos educativos.
El método científico es muy restrictivo y universalmente Hay una gran libertad en la utilización de distintos métodos
válido. cualitativos, siempre que se utilicen con conocimiento y
rigor.
Enfasis casi exclusivo en los productos o resultados de la No interesan exclusivamente los productos de los
enseñanza. aprendizajes, interesan fundamentalmente los procesos: lo
que ocurre en los contextos físicos, sociales, psicológicos y
filosóficos que rodean al hecho educativo.
El método experimental requiere un estricto control de las La evaluación cualitativa se produce en situaciones
variables intervinientes para asegurarnos que lo que ocurre naturales en las que el observador es un agente implicado
se ha producido como consecuencia de la causa estudiada. en el problema educativo concreto que se estudia.
Esto exige simular en el aula las condiciones de
laboratorio.
Para comprobar la eficacia de un método se deben No se pretende comprobar la eficacia de los métodos
mantener constantes todas las condiciones educativas manteniendo las condiciones constantes sino que se
aunque cambien las circunstancias. pretende reorientar y adaptar a los cambios el método que
se está utilizando, de forma que el método inicial puede
que no sea el mismo al final del programa.
La evaluación cuantitativa se preocupa por el grado en que La evaluación cualitativa se preocupa por analizar los
se han alcanzado los objetivos previamente establecidos al procesos educativos para que los propios agentes
comienzo de un programa. introduzcan los cambios oportunos para conseguir los
objetivos propuestos.
Validar métodos con carácter universal. Hacer válida la acción educativa concreta que se pone en
marcha en cada momento.
Hasta hace muy poco tiempo, en nuestro ámbito, era muy fácil encontrarse con el siguiente
reduccionismo: evaluar es igual a calificar a los alumnos.
Afortunadamente, muchas voces se han levantado en su contra, y así, sin negar esa función, la
evaluación se ha convertido en un elemento del proceso educativo con una incidencia muy fuerte en
otros aspectos y ámbitos que superan con mucho la figura del discente.
Evaluar programas, evaluar contextos, evaluar centros, evaluar profesores, evaluar materias... son
accidentes que ha de cumplir la evaluación dentro del sistema educativo. La evaluación ha ido
ampliando sus centros de influencia, hasta convertirse en uno de los ejes y en uno de los requisitos
imprescindibles, si queremos hablar con seriedad, de una enseñanza de calidad.
La preocupación por la evaluación en educación es antigua; pero no nos vamos a remontar a los
exámenes que los funcionarios chinos ya tenían que realizar 2.000 años antes de Cristo, ni nos
detendremos en la influencia positivista primera y la presión de la Psicología ejercida a través de las
«medidas mentales» de la inteligencia, la memoria, la atención, etc.
Como ya se ha señalado, a lo largo del último siglo, se han ido sucediendo, en función de las
necesidades de los investigadores educativos, distintos modelos de evaluación. Desde los puramente
cuantitativos, como el Tyler, centrado en la evaluación del producto de los resultados de la
enseñanza, hasta otros, más de tipo cualitativo, centrados en el análisis de los procesos, como los de
Scriven, Stufflebeam o Stake. Aunque no se agotan aquí todas las posibilidades, podríamos hablar
de la evaluación crítica de Eisner, de la evaluación iluminativa de Parlett y Hamilton, de la
evaluación democrática de MacDonald, de la eva1uación como investigación de Stenhouse, etc.
Estudiaremos ahora tres de los modelos de evaluación que más han influido en nuestro sistema
educativo a lo largo del último siglo. A través de su presentación podremos observar cómo han ido
cambiando las modas, desde concepciones positivistas centradas en los productos, hacia posiciones
más formativas basadas en la evaluación de los procesos.
Iniciaremos nuestro hipotético andar con la figura de Tyler; tras la Segunda Guerra Mundial. Su
aportación y preocupación por 1a evaluación en educación ha ejercido una gran influencia. Muchos
han sido sus seguidores. Todavía hoy, puede que sea su modelo uno de los más extendidos en el
panorama actual de la evaluación en los centros, si bien está siendo criticado y superado
ampliamente por otros planteamientos. Su concepción de la evaluación podría sintetizarse así:
Labores de diagnóstico.
Tratamiento posterior de aprendizajes defectuosos o lagunas.
modificación de objetivos.
Ajuste de objetivos.
Obtención de información para la dirección y administración educativas.
Guía indicadora para el profesor de su actividad y de su repercusión en el
aprendizaje de sus alumnos.
Proporcionar información para evaluaciones orientativas de procesos de
aprendizaje subordinados de dichas evaluaciones.
Proporcionar información para evaluaciones sumativas o finales dada su
especial preocupación por acabar ciclos o programas y así poder establecer las
comparaciones.
Las limitaciones, que son varias, tal como veremos al desarrollar otros modelos, hacen referencia,
principalmente, a:
Existe una clara distinción entre la evaluación sumativa (final) la evaluación formativa (o de
proceso); la primera tiene como objetivo el de certificar un estado resultante de los aprendizajes de
los alumnos respecto a unos objetivos preestablecidos, es decir; establecer unos niveles o unas
clasificaciones de los resultados obtenidos por los alumnos; la segunda por el contrario, pretende
proporcionar una información que sirva para que el alumno y el profesor puedan conducir
reconducir sus esfuerzos y sus trabajos dentro de unas coordenadas de acción que faciliten el
desarrollo de las actividades y faciliten aprendizaje mientras éste se está desarrollando. En palabras
de Scriven, recogidas por Stufflebeam y Shinkfield (1987:345) resulta que:
«La formativa ayuda a desarrollar programas y otros objetos; la sumativa calcula el valor del
objeto una vez que ha sido desarrollado y puesto en el mercado»
Esta idea es importante porque nos sitúa ante un hecho irreversible: hablar de evaluación sumativa
nos lleva a planteamientos cerrados y acabados, en tanto que la evaluación formativa nos invita a
procesos abiertos y flexibles.
La evaluación formativa o del proceso tiene como finalidad principal la de obtener información,
que, una vez contrastada en cuanto a su validez, nos lleve a desarrollar y optimizar el proceso objeto
de evaluación, es decir, el desarrollo y la ejecución de una determinada actividad o programa.
La característica esencial de las evaluaciones formativas o de proceso radican en que las decisiones
que se toman afectan al propio proceso; esto no ocurre con la evaluación sumativa cuyas
repercusiones afectan a otros procesos. Las «repeticiones», en una evaluación formativa, afectan a
secuencias o partes del proceso, considerando este no acabado; en una evaluación sumativa esas
«repeticiones afectan a otro proceso, entendiendo el anterior como algo acabado.
PUNTO DE CONTRASTACIÓN
DATOS PARA EMITIR JUICIOS
Por su parte, Stufflebeam concibe la evaluación del proceso como una parte de un planteamiento
evaluatorio más amplio al que denomina CIPP, o sea, evaluación del contexto (C), evaluación de
las entradas- inputs- (I), evaluación del proceso propiamente dicho (P) y evaluación del producto
(P). La finalidad del CIPP es perfeccionar un sistema, no demostrar su validez. Este modelo se
ajusta más a la evaluación de centros que a la evaluación de los aprendizajes individuales de los
alumnos, aunque pueden utilizarse también para esta tarea siempre que se realicen los ajustes
oportunos.
En la tabla siguiente se pueden observar las intenciones de Stufflebeam para cada uno de los
aspectos del CIPP
Para ello pueden Para ello se puede Para ello se debe tratar de Para ello puede utilizarse
utilizarse métodos inventariar y analizar establecer una continua como método de evaluación,
como la observación, los cursos humanos y interacción con el personal la tarea de definir
la inspección, la materiales disponibles. del proyecto y la operacionalmente y valorar
revisión de El estudio de las observación de sus los resultados, mediante la
documentos, las posibilidades de actividades. Los recopilación de los juicios de
¿Cómo
entrevistas, los viabilidad, cuestionarios, las planillas los clientes y la realización
evaluar?
cuestionarios, etc. aplicabilidad y las de observación de los de análisis cualitativos y
económicas. elementos centrales del cuantitativos.
proceso, los diarios y el
análisis de documentos son
buenos procedimientos para
la evaluación del proceso.
¿Para qué La evaluación del La evaluación de las La evaluación del proceso La evaluación del producto
evaluar? contexto permitirá entradas o imputs permitirá introducir en todo permitirá decidir la
definir el marco, las permitirá la selección momento los cambios continuación, la
metas, los objetivos de los recursos de necesarios para llevar a modificación o readaptación
y la planificación apoyo, los cabo y perfeccionar la o la finalización del
inicial del programa. procedimientos y las planificación y los programa.
capacidades del procedimientos del
sistema para llevar a programa.
cabo el proceso.
Teniendo en cuenta, como señala el propio Stufflebeam, que la evaluación es una parte integrante
del programa regular de una institución y no una actividad especial que se lleva a cabo en
determinados momentos, los objetivos de una evaluación formativa o de proceso podrían
sintetizarse en los siguientes:
Aportar una información suficiente y contrastada a las personas interesadas sobre el ritmo de
las actividades de un determinado programa. Si éstas se ajustan a lo planificado y si se
emplean los recursos de forma eficiente.
Proporcionar elementos de ayuda y orientación para modificar algún plan concreto
previamente establecido o justificar su inadecuación.
Indicar niveles de satisfacción tanto de ejecutores como de usuarios.
Elaborar un informe en el cual se recoja la calidad, el coste y el nivel de ajuste respecto a lo
planificado.
Los atributos de un paradigma no se hallan ligados ni a los métodos cualitativos ni a los cuantitativos.
Los paradigmas no constituyen el determinante único de la selección de los métodos.
La elección del método dependerá, en parte, de las exigencias de la situación que se pretende analizar.
La eficacia, validez y utilidad de una investigación o de una evaluación serán mayores en la medida que
hayamos logrado diseñar un proceso que se ajuste a las situaciones que comprende, de las cuales unas serán
de índole cuantitativa y otras cualitativas o, la mayoría de las veces, mixtas,
Los evaluadores han de sentirse libres para cambiar de paradigma cuando lo consideren
oportuno.
Que lo inapropiado es situar a cualquiera de los dos métodos en posición inferior
Que la evaluación de un programa puede verse fortalecida cuando en un diseño de
investigación se hallan integrados los dos paradigmas.
4. DISEÑOS DE EVALUACIÓN
Una vez identificados los componentes y subcomponentes que se van a evaluar y señaladas las
condiciones generales del proceso que se emprende, es necesario determinar el tipo de diseño más
adecuado para las finalidades que se pretenden (ver Cuadro que aparece más abajo). Decidido el
tipo de diseño, hay que precisar, dentro de su planteamiento genérico, las fases del trabajo, las
personas que deben intervenir, los recursos con que se cuenta, las técnicas que se utilizarán, los
instrumentos que deben emplearse o elaborarse, el tiempo previsto para su realización, etc.
Diseño experimental
Diseño quasiexperimental
La realización del diseño supone una importante toma de decisiones para hacer realidad la
evaluación proyectada; sin esta tarea previa, es fácil que no se alcancen los objetivos propuestos en
un principio.
En el cuadro anterior hemos presentado una posible clasificación de los tipos de diseños válidos
tanto para investigación como para evaluación. Según esta propuesta, podemos distinguir
básicamente tres tipos de diseños:
a) Experimental.
b) Quasi-experimental.
c) No experimental.
En principio, es válida la elección de cualquier tipo de diseño para realizar la evaluación global o
parcial de un centro, pero nos decantamos por los diseños no experimentales por su mayor
adecuación y utilidad en la evaluación interna y formativa de los centros escolares.
Así, aunque entendemos que para casos concretos, especialmente en la evaluación parcial de un
centro, puede emplearse un diseño experimental o quasi-experimental, creemos que las situaciones
habituales de la vida de un centro, consideradas globalmente, son más fácilmente valorables con
diseños no experimentales, por adecuarse mejor a la naturaleza compleja de estos hechos, a la
evaluación de procesos y a la dinámica diaria de la tarea educativa. Los diseños no experimentales
permiten incorporar las eventualidades que van apareciendo y, por ello, el ajuste de los pasos
establecidos previamente en ellos. De esta forma, la continua mejora del proceso y las
circunstancias en que éste se desenvuelve y la utilización de la evaluación como estrategia de
formación permanente en el centro, se convierten en una realidad.
En consonancia con la exposición que venimos haciendo, consideramos necesario realizar algunas
puntualizaciones que quizá orienten al lector a lo largo de las páginas que siguen:
La descripción de los tipos de diseño es sencilla y breve; en ella nos limitamos a destacar sus
principales características, de manera que el interesado disponga de unos elementos básicos de
juicio para decidir el tipo de diseño que puede resultar más conveniente en cada caso. Para su
ampliación, le remitimos a la bibliografía, donde podrá encontrar obras que tratan con mayor
profundidad los diseños mencionados.
Las funciones que se asignan al diseño experimental son complejas y variadas; siguiendo a De la
Orden, A. (1985, PP. 71-72), citamos entre ellas: «La formulación precisa de la hipótesis y su
traducción a términos estadísticos, la identificación tanto de la variable independiente (V. I.) como
de las extrañas y la toma de decisiones sobre los niveles de aquélla y el control de éstas, la
selección de la muestra, su tamaño y procedimiento de asignación, la selección de técnicas para la
medición de la variable dependiente (V. D.), la decisión sobre la prueba estadística y el nivel de
significación, y el grado de generalización de los resultados.»
Se ha utilizado frecuentemente este diseño para controlar, por ejemplo, el efecto de una nueva
metodología sobre el aprendizaje de grupos de alumnos. Para aplicarlo es necesaria la formación
aleatoria de los grupos y, también, contar con un grupo de control. Dada la dificultad de que se dé la
condición de aleatoriedad, en sentido estricto, dentro del campo educativo, y dados los problemas
éticos que en algunos casos puede plantear la manipulación de sujetos, se hace realmente difícil su
utilización en buena parte de la evaluación educativa, lo que no significa que para investigaciones
muy especificas no deba realizarse y, de hecho, se realice. No obstante, los obstáculos que presenta
su utilización en la evaluación interna de los centros, son prácticamente insalvables.
Considerando las dificultades del diseño experimental puro, los investigadores en educación
manifiestan, en los últimos años, una clara tendencia hacia la aplicación de la quasi-
experimentación.
No todas las leyes que rigen en el ámbito de la educación son leyes linealmente causales, sino que
más bien encontramos relaciones teleológicas (regidas por metas, intenciones, objetivos, etc.), o
bien ecológicas (orientadas por mecanismos complejos de adaptación). Ciertamente, el contexto en
el que ocurren los «hechos» constituye un sistema abierto donde aparecen interacciones de todo tipo
y en el que, por lo tanto, es casi imposible establecer relaciones causales puras. Por ello, hay que
convenir en que son mayores las posibilidades de aplicar el diseño quasi-experimental para obtener
resultados no reduccionistas en educación.
El objetivo principal de este diseño se centra, como en el caso anterior, en establecer ciertas
relaciones causales entre las variables estudiadas, pero sin exigir la completa aleatorización de los
grupos, por lo que resulta más sencilla y apropiada su utilización. Presenta, de este modo, un menor
grado de validez interna, pero un nivel aceptable de validez externa..
Los condicionantes a los que hemos aludido hacen que algunos autores achaquen a este tipo de
diseño un menor valor científico. No obstante, las ventajas que presenta, muy especialmente su
viabilidad y su escasa interferencia en el curso natural de los hechos, llevan a que los
investigadores/evaluadores recomienden este diseño para muchos estudios educativos.
Para caracterizar los diseños no experimentales habría que indicar que son aquellos que no
incorporan los elementos de control disponibles en los diseños anteriores. Es decir, no se controlan
y manipulan las variables (no se utiliza grupo de control, no se seleccionan y asignan sujetos por
procedimientos aleatorios) y no pretenden definir la estricta relación causa-efecto entre una variable
y otra. Por el contrario, sí pretenden descubrir relaciones entre los componentes de un hecho,
ofrecen una rica información sobre los procesos, explican las complejas interacciones que se
producen en los grupos humanos, dejan un gran margen para la interpretación, y por todo ello, sus
resultados no son generalizables, pero resultan de gran utilidad para la toma de decisiones en la
situación o el centro evaluados. Por lo tanto, desde un punto de vista experimental, estos diseños
resultan muy débiles; no obstante, «con fines formativos esto puede ser muy acertado; pero con
fines sumativos son mucho menos convenientes que los diseños más rigurosos» (Weiss, C. H.:
1982, pp. 93-94).
Y es precisamente por esta serie de razones por lo que mostramos nuestra preferencia por los
diseños no experimentales en la evaluación de centros: los fines que pretendemos con la evaluación
interna del centro son, justamente, su continua formación y mejora y, como dice Weiss, es en ese
campo en el que los diseños no experimentales encuentran su adecuada aplicación.
Este tipo de diseño ve amenazada su validez interna por la desaparición a corto plazo de la
muestra y la regresión estadística. No obstante, hay autores, como E. N. Kerlinger (1975), para
quienes este planteamiento es tan riguroso como el experimental, pero teniendo en cuenta su
aplicación a la investigación pedagógica, ya que el objeto de estudio (la educación) no posibilita
el control riguroso de variables y condicionamientos, como ya hemos comentado antes.
b) Diseño correlacional
e) Diseño longitudinal
Por las características de este diseño, algunos autores lo señalan como próximo a los diseños
quasi-experimentales e, incluso, cuando los diseños experimentales cuentan en su planteamiento
con observaciones sistemáticas repetidas en el tiempo, también participan de este carácter
longitudinal que acabamos de comentar. Por otro lado, si el diseño longitudinal se aplica a
hechos ya ocurridos, al menos en parte, se acerca a la caracterización de los diseños ex-post-
facto.
d) Diseño transversal
El diseño de evaluación transversal intenta salvar los inconvenientes de aplicación temporal que
se atribuyen al longitudinal y, para ello, la toma de datos y su valoración correspondiente se
realizan en un momento preciso, pero recogiendo información de muy diferentes estratos de
población. situaciones. edades, ámbitos de actuación, etc., de manera que sea posible deducir
unas ciertas tendencias de comportamiento a lo largo del tiempo aunque el estudio se realice en
un plazo realmente corto: «Un estudio transversal es aquel que produce una fotografía
instantánea de una población en un momento determinado. El resumen o compendio de un
estudio transversal es un censo nacional en el que una muestra representativa de la población
formada por individuos de diferentes edades, diferentes ocupaciones, diferente educación e
ingresos y residentes en diferentes partes del país, es entrevistada en el mismo día» (Cohen, L. y
Manion, L.: 1990).
Al igual que el anterior, este diseño de evaluación presenta ventajas e inconvenientes claros.
Haciendo referencia a los citados anteriormente, podría afirmarse que las ventajas de la
evaluación longitudinal corresponden a los inconvenientes de la transversal, y viceversa. En
concreto, las ventajas son su inferior coste económico y organizativo, la mayor rapidez en la
obtención de resultados, el mayor número de sujetos con los que se puede contar para su
realización y la facilidad para contar con la cooperación de los sujetos evaluados. FI
inconveniente básico es la dificultad de determinar tendencias en el comportamiento de los
grupos a lo largo del tiempo (sean éstos más o menos amplios) y, por tanto, el estudio de
procesos de desarrollo mediante este tipo de evaluación es sólo aproximativo. Un ejemplo
comparativo: si queremos conocer la incidencia de la aplicación de una reforma educativa en los
resultados obtenidos por los alumnos durante los seis primeros años de implantación, su
evaluación bajo un diseño de tipo longitudinal supondría realizar el estudio sobre los factores
que se desea evaluar al menos una vez al año. Al cabo de los seis años se podría redactar el
informe final de la evaluación con los resultados obtenidos. Si decidimos que no es posible
mantener el estudio anual a lo largo de todo ese tiempo, cabe la posibilidad de plantear una
evaluación con diseño transversal. Para ello, cuando hubiese finalizado el periodo de seis años,
se tomarían muestras de alumnos de los cursos 1º, 2º, 3º, 4º, 5º y 6º, con datos relativos a todos
los componentes que vayan a ser evaluados (áreas, disciplinas, metodología, modelo de
evaluación, organización del centro...). De esta forma se obtendría una visión global, pero
referida a los distintos momentos de implantación (cursos 1º, 2º, 3º, 4º, 5º y 6º) y a todos los
componentes que deseamos evaluar. Se consigue así un resultado similar al del diseño
longitudinal. No obstante, si deseáramos obtener mayor información sobre algún aspecto
concreto y profundizar en cualquiera de los factores estudiados, ya no sería posible, puesto que
este tipo de diseño se realiza cuando el proceso ha finalizado. Esto obstaculiza también la
posibilidad de reformulación, ajuste o corrección de las disfunciones que se vayan produciendo,
limitando, por tanto, los valores formativos de la evaluación y la efectividad de las decisiones
tomadas en el momento oportuno.
e) Estudio de casos
El diseño de evaluación caracterizado como estudio de casos aparece, como en las situaciones
anteriores, clasificado de diversas maneras. Vázquez Gómez, G. (1976) lo considera inscrito
dentro de los diseños quasi-experimentales, cuando es capaz de satisfacer, al menos en cierto
grado, las exigencias de validez interna y externa necesarias. No obstante, otros autores, como
Campbell, D. y Stanley, J. (1979), lo citan como diseño precientífico, al señalar que no controla
ninguna de las fuentes de invalidez. Lo incluimos ahora en los diseños no experimentales,
continuando con el criterio ya mencionado, no considerándolo estrictamente experimental ni
quasi-experimental, tanto por los principios generales que lo inspiran como por las situaciones a
las que generalmente suele aplicarse.
Este diseño de evaluación implica el estudio profundo de las características de una realidad
singular, de la unidad individual que se pretenda evaluar: un centro educativo, un alumno, una
pandilla, una clase, etc. Su propósito fundamental es conocer profundamente y analizar con
intensidad los diferentes fenómenos que componen esa unidad. Por lo tanto, la técnica principal
que se utiliza para la recogida de datos es la observación, complementada con la entrevista. De
esta forma, el evaluador incluso puede pasar a formar parte integrante del medio evaluado con la
pretensión de conocerlo en toda su amplitud (observación participante).
Interesa especialmente el conocimiento del proceso tal y como está ocurriendo y la opinión que
las personas intervinientes tienen de él, y resulta útil sobre todo cuando el objetivo de la
evaluación es comprender la naturaleza y la fenomenología de los procesos. La función asignada
al estudio de casos es doble: investigadora y formativa, puesto que se propone ayudar a los
protagonistas de la acción a conocer lo que hacen y a reflexionar sobre ello para mejorar su
actividad profesional.
Es evidente que este tipo de diseño se enmarca dentro del modelo cualitativo de evaluación
(metodologías naturalistas, idiográficas, iluminativas...) y últimamente se ha extendido
considerablemente en el ámbito de la evaluación de centros, ya que se adapta muy bien a las
necesidades evaluativas de los mismos y responde adecuadamente a los intereses de sus
miembros y a la forma de hacer que en estas instituciones tiene lugar.
f) Investigación-acción
f.1). Situacional
Se preocupa del diagnóstico de un problema en un contexto concreto y lo intenta resolver en
ese mismo contexto (en nuestro caso, el centro escolar).
f.2). Colaborador
Trabajan juntos el equipo de evaluadores y los profesionales del medio evaluado (profesores
y directivos).
f.3). Participativo
Los miembros del centro toman parte en la evaluación/investigación.
f.4). Autoevaluador
Se evalúan continuamente las modificaciones que se produzcan en la situación del centro,
siendo el último objetivo mejorar la práctica profesional específica.
Por otra parte, la investigación-acción se suele recomendar para el estudio o evaluación de métodos
de enseñanza, de estrategias de aprendizaje, de procedimientos de evaluación, de actitudes y
valores, de formación de profesionales en ejercicio, de cuestiones relacionadas con dirección y
control y de situaciones problemáticas de gestión. En resumen, puede resultar idónea para la
evaluación de muchos elementos que forman parte del funcionamiento de un centro educativo.
La inclusión de la investigación-acción dentro de los tipos de diseño no experimentales viene
justificada por su propio planteamiento, que no intenta controlar y manipular las variables, sino
explicar «desde dentro» la realidad de una situación social. De forma parecida al estudio de casos:
«se basa en dos principios esenciales: mejora y participación... Dado que es una forma de
investigación social... el campo de la interacción y la práctica humanas configura los lugares aptos
para la investigación y el perfeccionamiento» (Grundy, 5.: 1991, p. 193). Por otra parte, las técnicas
de recogida y análisis de datos que se ajustan a este tipo de diseño son las utilizadas habitualmente
por los investigadores o evaluadores cualitativos, ya que se adecuan mejor al estudio de la compleja
e interactiva realidad del centro educativo.
g) Diseño etnográfico
Siguiendo el trabajo realizado por Goetz, J. P. y Le Compte, M. D. (1988), sintetizo los rasgos de
los diseños etnográficos que nos pueden resultar más interesantes para su aplicación a la evaluación
de centros, ya que este diseño se suele utilizar para estudios de investigación más amplios dentro
del campo de evaluación de sistemas y, por tanto, con mayor complejidad e implicaciones que las
que aquí van a aparecer.
La etnografía educativa ha tomado la terminología y los procedimientos de trabajo del ámbito de la
antropología cultural y de la sociología cualitativa, siendo sus elementos básicos los siguientes:
Por lo tanto, supone la reconstrucción o descripción analítica de escenarios y grupos culturales (una
fotografía del medio estudiado, en nuestro caso el centro educativo), para llegar a esa visión
absolutamente real que pretende ofrecer. Con objeto de corregir los posibles sesgos de la
información y garantizar la objetividad de los datos, suelen aplicarse técnicas de triangulación.
Por su propia naturaleza, planteamientos básicos, técnicas utilizadas y objetivos pretendidos, este
diseño entra de lleno en los modelos cualitativos de evaluación y en el ámbito de los diseños no
experimentales.
La obra de Woods, P. (1987) es sumamente ilustrativa en relación con la aplicación del diseño
etnográfico a la evaluación del centro escolar.
BIBLIOGRAFÍA
Casanova, M. A. (1992). La evaluación, garantía de calidad para el centro educativo. Zaragoza: Edelvives.
Casanova, M. A. (1997). Manual de evaluación educativa. Madrid: La Muralla.
Ferrández Arenaz, A. y Jiménez Jiménez, B. (1989): Seguimiento y Evaluación de los Procesos Didácticos.
Madrid: Fondo Formación Empleo.
Guerrero López, J. F. (1991). Introducción a la Investigación Etnográfica en la Educación Especial.
Salamanca: Amarú.
LeCompte, M. D. (1995). Un matrimonio conveniente: diseño de investigación cualitativa y estándares para la
evaluación de programas. RELIEVE (Online), 1 (1). Disponible en http://www2.uca.es/RELIEVE/v1n1.htm (1
julio 1999).
Morales Domínguez, J.F. (1985). Metodología y teoría de la psicología. Madrid: UNED.
Rodríguez Diéguez, J. L. (1980 ). Didáctica General: 1. Objetivos y Evaluación. Madrid: Cincel.