Clase 3. Condicionamiento Operante
Clase 3. Condicionamiento Operante
Clase 3. Condicionamiento Operante
1. Interés en el control del ambiente: Skinner quería controlar, de una u otra manera,
aquellas variables extrañas que pudieran influir en su experimento, con el sujeto de
prueba (rata albina), por lo que diseña una caja en la que el ambiente puede variarse
(controlar las condiciones de iluminación, temperatura, sonido) para que este tipo de
variables extrañan no influyan en los resultados del experimento.
2. Control del comportamiento del sujeto : este control se logra a través de la administración
del refuerzo. Experimento: Cada vez que la rata bajaba la palanca, recibía un refuerzo
(comida); la rata aprende que al bajar la palanca recibe una bonificación.
3. Estudio intensivo del sujeto individual : se utilizan diseños con solo un (1) sujeto
experimental. Skinner planteaba que, si controlaba el ambiente y controlaba el
comportamiento del sujeto, entonces sólo necesitaba trabajar con un único individuo para
alcanzar los resultados deseados.
4. Interés en el comportamiento y sus leyes : (sin correlatos fisiológicos) se deriva que lo que
se conoce como las leyes de aprendizaje.
5. Programación y registros automáticos continuos: se realiza un estudio continuo de
aquellas conductas emitidas por el sujeto.
El registro acumulativo se hacía a través de una pluma que dibuja las respuestas mediante líneas a
una velocidad constante. Si se presenta una respuesta, la pluma oscila, de lo contrario dibuja una
línea vertical. Posteriormente, el experimentador observa de izquierda a derecha el número de
respuestas el en tiempo.
Tasa de respuesta: es una unidad sencilla y fácilmente medible. Viene determinada por el
número de respuestas sobre una unidad de tiempo. Ejemplo: en un intervalo de 20
minutos el sujeto emitió 30 respuestas o comportamiento, se realiza una división de el
tiempo y la cantidad de conductas, dando un resultado de 0,6 conductas o respuestas por
minuto.
¿Qué es un reforzador? Es cualquier estímulo que aumenta la probabilidad de que una conducta
aumente en el futuro. Es un estímulo externo que hace que el comportamiento se repita.
Primario: son los que funcionan de forma innata para todos los miembros normales de
una especie. Son estímulos como alimentos, agua o abrigo, necesarios para la
supervivencia.
Secundario: son aquellos cuya capacidad de reforzar no es innata, sino que se debe a
aprendizajes previos del organismo. Son aquellos que pueden aumentar la probabilidad de
la conducta, pero no es necesario para la supervivencia, ejemplo: chocolate. Son estímulos
que quedan condicionados por asociación con los reforzadores primarios (TazaLeche).
Reforzantes positivos: al ser añadido, aumenta la probabilidad de una respuesta. Este tipo
de refuerzos, provoca que la presencia de ellos aumente la probabilidad de la conducta, es
decir, que añadir un estímulo al entorno, atrae consigo que esa respuesta aumente o se
repita en el futuro.
Estos estímulos preceden o acompañan las respuestas, pero no las evocan. Incrementan la
probabilidad de las respuestas que en el pasado fueron reforzadas en presencia de los mismos
estímulos discriminativos.
Un estímulo discriminativo es aquel que nos sirve de señal ante alguna situación, y en la cual
nosotros debemos emitir una respuesta o conducta; sin embargo, estos no evocan la respuesta
porque el sujeto toma la decisión de hacerla o no. Ejemplo: la luz roja del semáforo, un letrero de
stop, letrero de no pisar el césped.
En la caja de skinner existen dos (2) estímulos discriminativos: un zumbador, y una luz.
Los estímulos discriminativos, al ser una señal, indican cuando se debe emitir una
respuesta o no.
Se plantea que la conducta no está controlada por sus antecedentes, sino por sus
consecuencias.
A B C A: Antecedentes.
B: Conducta.
Patrones o reglas que indican el momento y la forma en la que la aparición de una respuesta va a
ir seguida de un reforzador.
Reforzamiento continuo: se refuerza cada respuesta, una respuesta operante que alcanza
su tasa máxima, es mantenida en toda su fuerza, sólo si se le continúa reforzando. Las
operantes obtenidas por este tipo de reforzamiento se extinguen rápidamente cuando se
descontinua el reforzamiento.
Cada vez que el sujeto emita la respuesta deseada, se le refuerza.
Dependiendo del tipo de refuerzo, puede saturar al sujeto (si es un reforzamiento
primario, no hay saturación).
Programas de razón:
1. Programa de razón fija (RF): el refuerzo se obtiene después de un número fijo de
respuestas.
Se refuerza el comportamiento del sujeto experimental cada vez o cada cierto
número de respuestas que este emita. (RF5se refuerza el comportamiento una
vez que se ha emitido 5 veces)
2. Programa de razón variante (RV): el número de respuestas necesarias para
obtener un reforzador varía aleatoriamente.
(RV3 cada vez que el sujeto emita 3 veces la conducta se le da un reforzador; sin
embargo, se hace en torno a un promedio)
Programas de intervalo:
1. Programa de intervalo fijo (IF): el refuerzo de entrega al sujeto por la primera
respuesta transcurrido un tiempo. Este tiempo es constante de una ocasión a la
siguiente.
Este programa hace énfasis en el tiempo, y no el número de respuestas. (IF15se
refuerza la conducta cada 15 segundos, sin importar que la conducta emitida sea
diferente). Ejemplo: el corte de notas del colegio. Cada mes se entregan las notas,
y en función del puntaje obtenido, se entrega un refuerzo. Ejemplo: regalos de
cumpleaños (entregado cada 365 días).
El tiempo más óptimo va entre 1-3 minutos.
CONTINUACIÓN…
Encadenamiento: (diapositivas).
Se puede entender como una cadena unida por eslabones. Entonces se refiere a que
diversas conductas generan una mayor.
Ejemplo: lavarse los dientes (conducta macro). Tomar el cepillo dental (paso 1); abrir el grifo (paso
2); mojar el cepillo de dientes (paso 3); colocar crema dental en el cepillo (paso 4); cepillar los
dientes (paso 5); lavar el cepillo dental (paso 6); enjuagar la boca (paso 7).
Se refuerza cada vez que el organismo se comporta en alguna forma relacionada con el
objetivo que se desea lograr.
Pasos:
Economía de fichas: consiste en ir acumulando una serie de elementos ara obtener al final un
refuerzo. Esta debe caracterizarse porque siempre se gane algo o no se gane nada; sin embargo,
nunca se pierde. El refuerzo debe ser algo muy significativo para el sujeto.
Ejemplo: acomodar la cama. Se va marcando por la cantidad de días realizados (se acumula). Al
final de la semana, si ha cumplido con todos los días, se le premia.
Contrato conductual: es un acuerdo entre dos (2) personas donde se establece la conducta que se
quiere y el beneficio que se va a obtener.
Ejemplo: se le dice que niño que, si realiza su tarea todos los días, al finalizar la semana se le dará
un permio.
Adquisición: hace referencia a que el sujeto ha aprendido una nueva conducta, hay un aumento de
la probabilidad de que se produzca una determinada respuesta. Adquisición en el repertorio
conductual. Ejemplo: el aprender a amarrarse los zapatos, abotonarse la camisa.
Extinción: existe una disminución de la probabilidad de que una conducta ocurra por la no
presentación de un refuerzo. Ejemplo: la rata aprendió a presionar la palanca. Si esta continúa
presionando la palanca, pero deja de recibir refuerzo, entonces esta conducta va a disminuir o
extinguirse.
Discriminación del estímulo: existe una distinción de los estímulos. Ejemplo: la luz de el semáforo.
Existe una discriminación según el momento en el que se presente el estímulo; si en la noche
vemos la luz roja, se tiene tendencia a no detenerse, contrario a si se presenta en el día (existe una
generalización de la respuesta.
Contraste conductual: fenómeno que se presenta producto del aprendizaje de dos conductas
frente a dos estímulos discriminativos diferentes. Dependiendo del estímulo, se emiten
determinadas conductas. Ejemplo: luz del semáforo.