Stake (1975) ProgramEvaluation Español
Stake (1975) ProgramEvaluation Español
Stake (1975) ProgramEvaluation Español
PARTICULAR RESPONSABLE
EVALUACIÓN*
Por
Robert E. Stake
Centro de Investigación Instruccional y Evaluación Curricular
Universidad de Illinois en Urbana-Champaign
Noviembre de 1975
Documento # 5
Nuestro comité informó que era demasiado pronto para decidir sobre un
método particular o un conjunto de criterios para evaluar los programas educativos,
que lo que los investigadores educativos necesitaban era un período de trabajo de
campo y discusión para ganar más experiencia sobre cómo se podrían realizar los
estudios evaluativos. Ben Bloom, sucesor de Lee Cronbach en la presidencia de AERA,
consiguió que la AERPI patrocinara una serie de monografías sobre evaluación
curricular para el propósito que recomendamos. Los siete volúmenes completados
bajo el patrocinio de AERA se muestran en la sección de Referencia. En efecto, la serie
continuará bajo el patrocinio del Centro para el Estudio de la Evaluación de UCLA, cuya
directora, Mary Alkin, fue profesora invitada aquí en este Instituto de Investigación
Educativa hace dos años. Creo que esta serie de monografías puede llevarse una
buena parte del mérito o la culpa, I
,
a
Hay dos modelos principales para la evaluación de programas en 1965 y hay dos
en la actualidad. Uno es el estudio informal, tal vez un autoestudio, que generalmente
utiliza información ya disponible y se basa en las percepciones de personas
profesionales y autoridades respetadas. Es el enfoque de las asociaciones regionales
de acreditación de escuelas secundarias y universidades en los Estados Unidos y se
ejemplifica en el informe Flexner (1916) de educación médica en los EE. UU. Y en el
informe Coleman (1966) de igualdad.
de oportunidad educativa. En la hoja que recibió con su
material de lectura de fondo , uno titulado Nueve enfoques para el Apéndice
Evaluación educativa (ver A), lo he hecho muy brevemente; éste se conoce
allí como Enfoque de personal. La mayoría de
describió esta y otras modificaciones los educadores
del autoestudio institucional
Son parciales a esta evaluación de en el modelo, más aún si pueden especificar qué
quiénes son los miembros del panel o son los mineros. A los investigadores no les gusta
lo exacto porque se basa mucho en el la información de segunda mano. Pero hay
modelo. .
La mayoría de los investigadores han preferido el otro modelo, el modelo de
preprueba / posprueba, al que me he referido en la hoja Nueve enfoques como
Ganancia del estudiante mediante el enfoque de prueba. A menudo utiliza
declaraciones preespecificadas de objetivos conductuales, como las que se
encuentran disponibles en el Instructional Objectives Exchange de Jim Popham, y
está muy bien representado por Tyler (1942) Eight-Year Study, Husen (1967)
International Study of Achievement in
Matemáticas y la Evaluación Nacional del Progreso Educativo. El foco de atención con
este modelo está principalmente en el desempeño de los estudiantes.
tu rn al mismísimo
últimas páginas, páginas 26 y 27 (ver Apéndice B). O 26 años tu
notario público
resumen de las cargas más dañinas que pueden t rea ser sondamente
hecho. Para nosotros era importante dejar el iss ue resuelto, a
Naciones Unidas
Deje que el lector decida qué reclamo aceptar, yo F alguna. Pero nosotros
Permítanme comenzar con una definición básica, una que obtuve de Mike
Scriven. La evaluación es un VALOR OBSERVADO en comparación con algunos
ESTÁNDAR. Es una razón simple, pero este numerador no es simple.
I n la evaluación del programa pertenece a la totalidad
constell ionade valores mantenidos para el programa. Y el nombre r no es simple
a
porque pertenece al complejo de expectativas y criterios que diferentes personas
tienen paraiotal programa.
La tarea básica para un evaluador se hace apenas tolerable por el hecho de que
no tiene que resolver esta ecuación de alguna manera numérica ni obtener una
calificación descriptiva resumida, sino que simplemente necesita hacer una
declaración completa de lo que se observa que es el programa. con referencias útiles a
la satisfacción e insatisfacción que sienten hacia él las personas seleccionadas
apropiadamente. Cualquier cliente en particular puede querer más que esto; pero esto
satisface el concepto mínimo, creo, de un estudio de evaluación.
¿Se benefician todos los estudiantes o solo unos pocos específicos? ¿El
programa se adapta a instructores con calificaciones inusuales?
Evaluación receptiva
Para estar al servicio y enfatizar los aspectos de evaluación que son importantes
para cada programa en particular, recomiendo el evaluación receptiva Acercarse. Es un
enfoque que sacrifica cierta precisión en la medición, con suerte para aumentar la
utilidad de los hallazgos para las personas dentro y alrededor del programa. Muchos
planes de evaluación son más “preordenados”, enfatizando (1) la declaración de metas,
(2) el uso de pruebas objetivas, (3) los estándares sostenidos por el personal del
programa y (4) los informes de tipo de investigación. La evaluación receptiva depende
menos de la comunicación formal y más de la comunicación natural.
Propósito y Criterios
Cada uno de estos propósitos está relacionado directa o indirectamente con los
valores de un programa y puede ser un propósito legítimo para un estudio de
evaluación en particular. Es muy importante darse cuenta de que cada propósito
necesita datos separados; todos los propósitos no se pueden cumplir con una sola
recopilación de datos. Solo se puede prestar especial atención a unas pocas preguntas.
No debemos dejar que Astin y Panos decidan qué preguntas atender, o Tyler o Stake.
Cada evaluador, en cada situación, tiene que decidir qué atender. El evaluador tiene
que decidir.
A veces será importante que el evaluador haga lo mejor para medir los su
resultados de los estudiantes, otras veces no. Creo que hay pocos datos mi
"críticos" en cualquier estudio, al igual que hay pocos componentes "críticos" en re
cualquier experiencia de aprendizaje. El alumno es capaz de utilizar muchos él
caminos, muchas tareas, para obtener su medida de habilidad y "beneficio" en
estético. El evaluador toma diferentes caminos para revelar los beneficios del lata
programa. Las pruebas y otras recopilaciones de datos no deben considerarse
esenciales; ni tampoco deben descartarse automáticamente. La elección de r
estos instrumentos en la evaluación receptiva debe hacerse como resultado de
observar el programa en acción y de descubrir los propósitos importantes para ult
los diversos grupos que tienen interés en el programa.
t en
Estructura sustantiva
1). Puede notar que mis categorías no son muy diferentes de las que piden los
modelos de Dan Stufflebeam y Mal Provus.
eval uation st
Me gusta pensar en todos estos datos como observaciones: los datos, los
inte estándares, los juicios y las declaraciones de fundamento también son datos
obse importantes. Tal vez fue un error etiquetar solo la nd columna como
seco "observaciones". Thoreau dijo: "¿Podría una mayor
milagro que nos miremos a través de los ojos por un instante ".
Los observadores humanos son los mejores instrumentos que tenemos para
muchas cuestiones de evaluación. Los datos de rendimiento y los datos de
preferencias se pueden escalar psicométricamente cuando se requieren datos
cuantificados objetivamente. Lo importante para el evaluador es obtener su
información en cantidad suficiente de numerosas fuentes independientes y creíbles
para que represente efectivamente el estado percibido del programa, por más
complejo que sea.
Estructura funcional
“Qué datos” es una cosa, pero “cómo hacer la evaluación” es otra. Mi plan de
evaluación receptiva asigna una gran cantidad de recursos de evaluación a la
observación del programa. El plan no está dividido en fases porque la observación y
la retroalimentación continúan siendo las funciones importantes desde la primera
semana hasta la última. He identificado doce eventos recurrentes. Aquí en la pantalla
(ver figura 2) los muestro como en la esfera de un reloj. Sé que algunos de ustedes
me recordarán que un reloj se mueve en el sentido de las agujas del reloj, así que me
apresuro a decir que este reloj se mueve en el sentido de las agujas del reloj, en
sentido contrario a las agujas del reloj y en sentido transversal. En otras palabras,
cualquier evento puede seguir a cualquier evento. Además, muchos eventos ocurren
simultáneamente; y el evaluador regresa a cada evento muchas veces antes de que
finalice la evaluación.
Preordenado Sensible
104).
Entonces el problema pasa a ser el de volver a poner nuestra vida en contacto con
nuestra cultura, convirtiéndola de nuevo en una cultura viva. Para lograrlo, primero
tendremos que matar “el respeto por lo que está escrito en blanco y negro ...” para
romper nuestro lenguaje para que se pueda volver a armar para restablecer el contacto
con “lo absoluto , ”O como prefiero decir, con“ realidad múltiple ”; es imperativo
“empujar de nuevo al ser humano a verse a sí mismo como realmente es” (p. 298).
Utilidad y legitimidad
Los propósitos de las audiencias son de suma importancia. ¿Qué les gustaría
poder hacer con la evaluación del programa? Lo más probable es que no tengan
planes de usarlo. Pueden dudar de que el estudio de evaluación les sea de utilidad.
Pero los gráficos, los productos, las narrativas y las representaciones no afectan a las
personas. Con estos dispositivos, las personas se vuelven más conscientes del
programa, desarrollan un sentimiento por sus fuerzas vitales, un sentido de sus
decepciones y problemas potenciales. Es posible que estén mejor preparados para
actuar en cuestiones como un cambio de inscripción o una
reasignación de recursos. Es posible que puedan proteger mejor el programa.
Por supuesto, estas etiquetas descriptivas son una gran simplificación. superposición. Diferentes Los enfoques
proponentes y diferentes usuarios tienen diferentes protagonistas reconocen que un enfoque no estilos. Cada
es ideal para todos los propósitos. incluir varios enfoques. La cuadrícula es una simplificación Cualquier estudio puede
excesiva. muestran algunas diferencias típicas y burdas entre las evaluaciones contemporáneas estar destinado a
actividades.
apéndice B
Todo especialista en currículo teme que, al relajar las reglas de conducta y alentar la
independencia de los estudiantes, puedan estar diciendo adiós al trabajo duro y al pensamiento duro
que requiere la educación. Los profesores y estudiantes de TCITY-71 hicieron que el aprendizaje fuera
tan atractivo, tan intencionado, que el pensamiento libre volvía una y otra vez a los temas curriculares:
conciencia de la condición humana, obstáculos a la comunicación, interacciones ecológicas, etc.
TCITY sobresale por su personal. Sus estudiantes le dan movimiento. Sus directores lo
nutren. Sus maestros le dan movimiento, nutrición y dirección. Sería incorrecto decir que el Sr.
Caruson, el Sr. Rose y los maestros piensan de la misma manera en cuanto a los principales objetivos
y métodos de educación, pero, colectivamente, crean un currículo dinámico, humanista y con base
académica.
La calidad de la enseñanza este verano fue consistentemente alta, día a día, de clase en clase.
Algunos de los maestros optaron por ser informales, para ofrecer "oportunidades", para compartir
una experiencia significativa. Otros fueron más intensos, más decididos a compartir información y
métodos de resolución de problemas. Ambos tipos estuvieron ahí, haciéndolo bien.
La calidad del aprendizaje también fue alta. Los estudiantes estaban sintonizados. Estaban
ocupados. Respondieron a los movimientos de su
profesores. Improvisaron, llevaron ideas y argumentos, indignaciones y admiraciones, a la cancha de
voleibol, al Commons, a la sombra de los olmos del campus y los robles del Cannon River. Los jóvenes
dieron un gran paso hacia la madurez.
Es cierto que fue un paso costoso. Miles de horas, miles de dólares y al menos unos cientos de
agravios. Pero si se ajusta a una escala de presupuestos de escuelas públicas, y presupuestos para
parques, carreteras interestatales y armas de guerra, TCITY-7l califica como MEJOR COMPRA. 800
niños, más o menos, se llevaron a casa un nuevo talento, una nueva línea de pensamiento, una nueva
conciencia, una buena compra.
No se puede negar que otros jóvenes de Minneapolis y St. Paul merecen una experiencia como
esta. Deberían tenerlo. Algunos dicen: "ICIlY es malo porque atiende a la élite". Pero una mayor
sabiduría dice: "Cualquier esfuerzo centrado en dar una parte igual de cosas buenas a todos los grupos
está destinado a no compartir nada de valor". Para los jóvenes menos favorecidos, debe garantizarse
una participación más equitativa de las oportunidades educativas. Pero incluso en tiempos de recesión
económica, se deben proteger las oportunidades para los talentosos.
(Preparado por R. Stake, no para indicar su opinión sobre el Instituto, sino como un
resumen de las afirmaciones más positivas que razonablemente se podrían hacer).
INFORME DE EVALUACIÓN DE TCITY-197l: DECLARACIÓN DE UN ADVERSARIO
TCITY no es un escándalo magnatum. Pero es menos de lo que pretende ser y más de lo que
desea ser. Hay suficiente evidencia al menos para cuestionar ciertas facetas del Instituto, si no para
devolver un verdadero proyecto de ley en su contra. Costoso, ampliado, innovador, ejemplar: estos
atributos del Instituto merecen un examen crítico.
¿Qué tan costoso es este Instituto? Los costos en dólares son suficientes para darle a cada
grupo de seis estudiantes $ 1,000 para diseñar y llevar a cabo su experiencia de verano ganada. Más de
100 estudiantes de Upward Bound podrían prepararse para sus carreras universitarias en Macalester.
Aproximadamente veinticinco especialistas en currículo expertos podrían recibir apoyo durante medio
año para diseñar y desarrollar nuevos currículos para la escuela secundaria.
¿Cuál es el costo de eliminar a 800 líderes talentosos de la cultura juvenil local? ¿Cuál es el costo
de ampliar la brecha de experiencia entre los estudiantes del Instituto y sus padres? ... ¿y sus maestros
en la escuela secundaria "regular"? ... ¿y sus amigos que no son del Instituto? No es suficiente aquí para
acusar el elitismo neofasista. Suficiente para justificar la discusión.
*** ¿Cuánto tiempo puede continuar el "rap" en clase y aún calificar como
autoexploración educativa? ¿Existen procedimientos de control de calidad en vigor
durante el programa de verano? Por ejemplo: cuando entre un tercio y la mitad de
una clase está ausente de una reunión programada, ¿no debería el instructor
considerarlo como una crisis educativa?
*** ¿Qué hace TCITY para ayudar a los estudiantes a darse cuenta de que los estándares
del Instituto son necesariamente altos? que las normas y expectativas de las escuelas
regulares no cuentan; que un "mejor" hasta ahora se convierte en un "regular"? Hay
estudiantes innecesariamente desanimados en TCITY.
*** ¿Es irrazonable esperar que más de dos de los veintidós maestros o maestros
asociados tengan una idea clara o un plan para utilizar los enfoques o planes de
estudio de TCITY en sus aulas regulares el próximo otoño?
(Preparado por T. Denny, no para indicar su opinión sobre TCITY-1971, sino como un resumen
de los cargos más dañinos que razonablemente se podrían hacer).