Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                
0% encontró este documento útil (0 votos)
127 vistas9 páginas

Clase 3. Condicionamiento Operante

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1/ 9

CLASE 3. CONDICIONAMIENTO OPERANTE.

INTRODUCCIÓN: este trabajo se vincula a Skinner, quien se enfoca en el estudio del


comportamiento humano, basándose en los estudios antecedentes de Thorndike. El
condicionamiento operante tenia por objetivo demostrar que el comportamiento del sujeto
estaba determinado por sus consecuencias y no por sus antecedentes. Se enfoca en que las
respuestas del sujeto están precedidas por sus consecuencias.

 Un sujeto puede aumentar la probabilidad de una respuesta si recibe un refuerzo o


también si se retira un estímulo aversivo.
 Se plantea que el tipo de respuestas que se generan son voluntarias.

Consiste en un proceso de ejercer control sobre la conducta de un organismo en cierto ambiente y


que este control se puede ejercer sobre la conducta del organismo de un sujeto a través de la
aplicación del refuerzo.

 Refuerzo: el más utilizado es el refuerzo positivo y el refuerzo negativo (diferente de


castigo).

Características del Condicionamiento Operante: (diapositivas).

Se hace énfasis en cinco (5) características básicas o principales:

1. Interés en el control del ambiente: Skinner quería controlar, de una u otra manera,
aquellas variables extrañas que pudieran influir en su experimento, con el sujeto de
prueba (rata albina), por lo que diseña una caja en la que el ambiente puede variarse
(controlar las condiciones de iluminación, temperatura, sonido) para que este tipo de
variables extrañan no influyan en los resultados del experimento.
2. Control del comportamiento del sujeto : este control se logra a través de la administración
del refuerzo. Experimento: Cada vez que la rata bajaba la palanca, recibía un refuerzo
(comida); la rata aprende que al bajar la palanca recibe una bonificación.
3. Estudio intensivo del sujeto individual : se utilizan diseños con solo un (1) sujeto
experimental. Skinner planteaba que, si controlaba el ambiente y controlaba el
comportamiento del sujeto, entonces sólo necesitaba trabajar con un único individuo para
alcanzar los resultados deseados.
4. Interés en el comportamiento y sus leyes : (sin correlatos fisiológicos) se deriva que lo que
se conoce como las leyes de aprendizaje.
5. Programación y registros automáticos continuos: se realiza un estudio continuo de
aquellas conductas emitidas por el sujeto.

El registro acumulativo se hacía a través de una pluma que dibuja las respuestas mediante líneas a
una velocidad constante. Si se presenta una respuesta, la pluma oscila, de lo contrario dibuja una
línea vertical. Posteriormente, el experimentador observa de izquierda a derecha el número de
respuestas el en tiempo.

 Tasa de respuesta: es una unidad sencilla y fácilmente medible. Viene determinada por el
número de respuestas sobre una unidad de tiempo. Ejemplo: en un intervalo de 20
minutos el sujeto emitió 30 respuestas o comportamiento, se realiza una división de el
tiempo y la cantidad de conductas, dando un resultado de 0,6 conductas o respuestas por
minuto.

Tipos de estímulos en Condicionamiento Operante: (diapositivas).

¿Qué es un reforzador? Es cualquier estímulo que aumenta la probabilidad de que una conducta
aumente en el futuro. Es un estímulo externo que hace que el comportamiento se repita.

 Primario: son los que funcionan de forma innata para todos los miembros normales de
una especie. Son estímulos como alimentos, agua o abrigo, necesarios para la
supervivencia.
 Secundario: son aquellos cuya capacidad de reforzar no es innata, sino que se debe a
aprendizajes previos del organismo. Son aquellos que pueden aumentar la probabilidad de
la conducta, pero no es necesario para la supervivencia, ejemplo: chocolate. Son estímulos
que quedan condicionados por asociación con los reforzadores primarios (TazaLeche).

 Reforzantes positivos: al ser añadido, aumenta la probabilidad de una respuesta. Este tipo
de refuerzos, provoca que la presencia de ellos aumente la probabilidad de la conducta, es
decir, que añadir un estímulo al entorno, atrae consigo que esa respuesta aumente o se
repita en el futuro.

Es un procedimiento en que la respuesta instrumental produce un estímulo apetitivo para el


organismo; esto implica que haya un incremento en la tasa de respuesta. Ejemplo: la comida. La
rata al recibir el alimento (reforzante positivo primerio), aumentaba la probabilidad de que se
repita la conducta (presionar la palanca).

 Reforzantes negativos: al ser eliminado, aumenta la probabilidad de una respuesta. Se


llama refuerzos negativos al aumento de la probabilidad de una conducta, como
consecuencia de una omisión de un estímulo.

La respuesta instrumental termina al estímulo aversivo, es decir, aumenta la probabilidad de una


conducta para retirar aquello que, de una u otra manera, resulta aversivo o no agrada al sujeto
experimental. Los procedimientos de los reforzantes negativos aumentan la tasa de respuesta.

 La conducta aumenta para eliminar el estímulo aversivo.

 Discriminativos: es aquel estímulo que indica que está establecida la relación de


contingencia entre la respuesta y la consecuencia. No son estímulos que provoquen una
respuesta, sino más bien tienen como función ser una señal; de este modo controlan la
conducta indicando cuál es la ocasión de realizar o no una respuesta. Ejemplo: semáforo.

Estos estímulos preceden o acompañan las respuestas, pero no las evocan. Incrementan la
probabilidad de las respuestas que en el pasado fueron reforzadas en presencia de los mismos
estímulos discriminativos.

Un estímulo discriminativo es aquel que nos sirve de señal ante alguna situación, y en la cual
nosotros debemos emitir una respuesta o conducta; sin embargo, estos no evocan la respuesta
porque el sujeto toma la decisión de hacerla o no. Ejemplo: la luz roja del semáforo, un letrero de
stop, letrero de no pisar el césped.

 En la caja de skinner existen dos (2) estímulos discriminativos: un zumbador, y una luz.
 Los estímulos discriminativos, al ser una señal, indican cuando se debe emitir una
respuesta o no.

Paradigma del Condicionamiento Operante: (diapositivas).

 ED  RO  ER (+ o -) ED: Estímulo Discriminativo.

RO: Respuesta Operante.


Luz Picoteo Comida
ER: Estímulo Reforzante.

El paradigma plantea que una conducta, en presencia de un estímulo particular (estímulo


discriminativo), se hace más probable si es seguido de una consecuencia o de un estímulo
reforzante (positivo o negativo).

 Se plantea que la conducta no está controlada por sus antecedentes, sino por sus
consecuencias.

También se conoce la triple relación de contingencia:

 A  B  C A: Antecedentes.

B: Conducta.

Me molestan Lloro Me consuelan C: Consecuencias.

Programa de reforzamiento: (diapositivas).

Patrones o reglas que indican el momento y la forma en la que la aparición de una respuesta va a
ir seguida de un reforzador.

 Indican cuando se va a reforzar al sujeto.

Existen dos (2) tipos básicos de reforzamiento:

 Reforzamiento continuo: se refuerza cada respuesta, una respuesta operante que alcanza
su tasa máxima, es mantenida en toda su fuerza, sólo si se le continúa reforzando. Las
operantes obtenidas por este tipo de reforzamiento se extinguen rápidamente cuando se
descontinua el reforzamiento.
 Cada vez que el sujeto emita la respuesta deseada, se le refuerza.
 Dependiendo del tipo de refuerzo, puede saturar al sujeto (si es un reforzamiento
primario, no hay saturación).

 Reforzamiento intermitente: se deben generar estrategias que permitan mantener ciertos


niveles de respuesta sin necesidad de seguirla reforzando en forma continua (RFC) y, de
acuerdo con la conducta específica, que los niveles de respuesta sean altos, bajos o
intermedios, para considerarlos adecuados. El logro de este objetivo es progresivo y para
ello se han diseñado los “programas de reforzamiento intermitente”.
 Se busca una estrategia en la que el sujeto pueda seguir manteniendo la conducta sin
necesidad de refuerzo constante.

Existen, además, cuatro (4) programas de reforzamiento: reforzamiento simple.

 Programas de razón:
1. Programa de razón fija (RF): el refuerzo se obtiene después de un número fijo de
respuestas.
Se refuerza el comportamiento del sujeto experimental cada vez o cada cierto
número de respuestas que este emita. (RF5se refuerza el comportamiento una
vez que se ha emitido 5 veces)
2. Programa de razón variante (RV): el número de respuestas necesarias para
obtener un reforzador varía aleatoriamente.
(RV3 cada vez que el sujeto emita 3 veces la conducta se le da un reforzador; sin
embargo, se hace en torno a un promedio)
 Programas de intervalo:
1. Programa de intervalo fijo (IF): el refuerzo de entrega al sujeto por la primera
respuesta transcurrido un tiempo. Este tiempo es constante de una ocasión a la
siguiente.
Este programa hace énfasis en el tiempo, y no el número de respuestas. (IF15se
refuerza la conducta cada 15 segundos, sin importar que la conducta emitida sea
diferente). Ejemplo: el corte de notas del colegio. Cada mes se entregan las notas,
y en función del puntaje obtenido, se entrega un refuerzo. Ejemplo: regalos de
cumpleaños (entregado cada 365 días).
 El tiempo más óptimo va entre 1-3 minutos.

2. Programa de intervalo variable (IV): el refuerzo está disponible después de un


tiempo que varía aleatoriamente.
Se refuerza el tiempo. (IV5se refuerza cada 5 segundos, sin embargo, este
tiempo cambiará en torno a un promedio).
 Este programa es el más efectivo debido a que existe mayor resistencia a
la extinción de una conducta. El sujeto, al no saber cada cuanto se
reforzará, seguirá emitiendo la conducta para hasta obtener el reforzador.

Programa de reforzamiento Ejemplo


Continuo El perro recibe un premio cada vez que detecta sustancias
alucinógenas.
Razón fija. Un vendedor de una editorial recibe una comisión cada cinco
ventas.
Razón variable. Las máquinas traga-monedas están programadas para dar un
premio cada cierto número de monedas que varía en torno a
un promedio.
Intervalo fijo. Los alumnos que tienen que presentar un trabajo, sólo se
preocupan de él a última hora.
Intervalo variable. Un profesor realiza exámenes sorpresa, al menos uno cada
dos semanas.

Programa Definición Ejemplo Respuesta


Intervalo fijo. Reforzamiento Reforzar la primera Tasa de respuesta
predecible, basado en respuesta correcta incrementada por la
el intervalo de tiempodespués de un inminente aparición
establecido intervalo de 5 de reforzamiento.
minutos.
Intervalo variable. Reforzamiento Reforzar la primera Tasa de respuesta
impredecible, basado respuesta correcta lenta y estable; pausa
en intervalo de después de 5 muy breve del
tiempos cambiantes. minutos, luego al reforzamiento.
cabo de 7, 2, y 8
minutos.
Razón fija. Reforzamiento Reforzamiento cada Tasa de respuestas
predecible, basado en 10 respuestas alta; pausa después
un número correctas. del reforzamiento.
establecido de
respuestas.
Razón variable. Reforzamiento Reforzamiento de la Tasa de respuesta
impredecible, basado décima respuesta muy alta; pausa
en un número correcta, después de pequeña después del
variable de la séptima, luego de reforzamiento.
respuestas. la novena, y de la
decimosegunda.

CONTINUACIÓN…

Encadenamiento: (diapositivas).

Forma compleja de condicionamiento en que las unidades condicionadas simples se vinculas en


secuencia (varias condutas simples que implican una conducta macro o compleja).

 Se puede entender como una cadena unida por eslabones. Entonces se refiere a que
diversas conductas generan una mayor.

Ejemplo: lavarse los dientes (conducta macro). Tomar el cepillo dental (paso 1); abrir el grifo (paso
2); mojar el cepillo de dientes (paso 3); colocar crema dental en el cepillo (paso 4); cepillar los
dientes (paso 5); lavar el cepillo dental (paso 6); enjuagar la boca (paso 7).

Ejemplo de conductas macro: tocar un instrumento, cocinar, cadenas conductuales cotidianas,


conducir un vehículo, lavarse los dientes.
Moldeamiento: (diapositivas).

También conocido como “Aprendizaje por Aproximaciones Sucesivas”.

 La conducta terminal se logra mediante el reforzamiento de pequeños pasos hacia la


respuesta final deseada.

Es el refuerzo de aproximaciones sucesivas al objetivo. Es un procedimiento que me permite


instaurar una conducta que no se encontraba en el repertorio conductual, esto implica seguir
etapas, pasos.

 Se refuerza cada vez que el organismo se comporta en alguna forma relacionada con el
objetivo que se desea lograr.

Ejemplo: que la rata presione la palanca.

Pasos:

 Definir conducta meta. Objetivo.  Presionar la palanca.


 Escoger respuesta con un nivel operante mínimo. Elegir el comportamiento de punto de
partida. Elegir el comportamiento por el cual se inicia.  Que la rata observe la
palanca. /Acercarse al área de la palanca. /Que la rata husmee con el hocico la
palanca. /Que la rata toque la palanca con una pata. /Que la rata toque la palanca con
dos (2) patas. /Que la rata presione la palanca.
 Llevar al sujeto por aproximaciones sucesivas a la respuesta meta. Una vez planteada cada
aproximación, se le refuerza a la rata para que tenga un indicio de lo que se desea y realice
la conducta. Cada vez que la rata realice una respuesta mínima, se le refuerza.  Si ve la
palanca, se le refuerza. /Si se acerca a la palanca, se le refuerza…
 Reforzar diferencialmente las respuestas de aproximación. Por cada conducta de
aproximación no se deben dar más de 3-5 refuerzos.  Si la rata mira 5 veces la palanca,
se le refuerza, pero si lo hace una sexta (6) vez y no se acerca a la palanca, se le deja de
reforzar.

 Cuando el sujeto ya ha superado una conducta de aproximación y vuelve a la conducta


anterior, no se le refuerza.
 Puede aparecer una conducta supersticiosa, siendo esta una conducta que se asocia
accidentalmente con el refuerzo.  La rata toca la palanca (conducta deseada) y se rasca
la barriga (sin interés del experimentador) y el experimentador refuerza la conducta, la
rata entiende que debe tocar la palanca y rascarse la barriga, es secuencia, para recibir el
refuerzo.

IMPORTANTE: un requisito para que sea considerado “moldeamiento” es que se aplican


exclusivamente las contingencias de reforzamiento. No se pueden emplear ningún tipo de
recursos como por ejemplo, las instrucciones (si se experimenta con un sujeto humano), ni
ejemplos de modelamiento (el experimentador demuestra la conducta que el sujeto debe imitar).

Técnicas para extinguir conductas: (diapositivas).

 Reforzamiento diferencial: dividido en cuatro (4) etapas.


1. Reforzamiento diferencial de alta tasa de conducta (RDAT): la teoría plantea que
una conducta que se presenta en una tasa alta de respuesta que no es normal
baje o debe llevarse hasta una tasa aceptable de respuesta.
Ejemplo: un alumno que levante demasiado la mano para intervenir y que no le dé
oportunidad a los demás. El profesor lo refuerza planteándole que si levanta la
mano un máximo de cinco (5) veces, tendrá 10min más de receso.
2. Reforzamiento diferencial de baja tasa de conducta (RDBT): la teoría dice que una
conducta con una baja tasa de respuesta se refuerza para incrementarla, hasta
llevarla a una tasa apropiada de respuesta, y que esta se mantenga.
Ejemplo: un niño que no participa en clase. El maestro busca una estrategia para
que el niño intervenga en clase. Si en el transcurso de las dos (2) horas de clase,
participas al menos tres (3) veces, yo te permito 10min más en el recreo.
3. Reforzamiento diferencial de condutas incompatibles (RDCI): varía o depende de
la conducta que se desea extinguir. Se refuerza la conducta contraria u opuesta.
Ejemplo: un niño hace berrinches. Cuando e niño hace un berrinche, en vez de
darle una galleta o un juguete para tranquilizarlo, se ignora, hasta el punto en el
que el niño se dé cuenta que con el berrinche no obtiene gratificación o refuerzo; y,
en vez de eso, se le refuerza cuando esté tranquilo/calmado, jugando.
4. Reforzamiento diferencial de otras conductas (RDO): se refuerza cualquier
conducta, excepto la que se desea extinguir.
Ejemplo: un niño que siempre está de pie en clase. Se le ignora al estar de pie, pero
se le refuerza cada vez que está sentado/copiando/participando.
 Tiempo fuera o time out, (de exclusión, sin exclusión, y cambio de condiciones
ambientales): retirar al sujeto del ambiente donde este emite el comportamiento. No
implica o no debe implicar algo aversivo para el sujeto, solo se eliminan los estímulos
reforzantes que hacen que el sujeto tenga esa determinada conducta que se desea
extinguir.
1. De exclusión: se retira al sujeto y se envía a un ambiente totalmente neutro, que
no sea percibido como algo aversivo o negativo (castigo).
Ejemplo: un niño se porta mal. Se retira del ambiente y se lleva a un espacio
aparte, donde no se tengan estímulos distractores. Es necesario explicar la razón
de esta exclusión.
2. Sin exclusión: se retira al sujeto de la situación, pero se mantiene en el mismo
ambiente.
Ejemplo: un niño se porta mal. Se retira de la situación, pero se le deja en el mismo
ambiente; es decir, se retira de la mesa con sus compañeros y se le sienta en otra
misma, pero en la misma aula de clases.
3. Cambio de condiciones ambientales: hace referencia a cuando hay un cambio
brusco en el ambiente que hace que el sujeto perciba que la conducta que está
teniendo no es la adecuada.
Ejemplo: un profesor está dando una clase y un grupo de estudiantes no está
atendiendo a la misma. Al profesor hacer silencio, los alumnos perciben este
cambio y entienden que deben hacer silencio.
Ejemplo: un niño se chupa el dedo cuando ve televisión. El niño va al psicólogo y
éste lo ubica en un lugar neutro y se le enciende el televisor. Cuando el niño se
chupe el dedo, el televisor de apaga. Al repetir esto una determinada cantidad de
veces, el niño entenderá que chuparse el dedo es lo que ocasiona que el televisor
se apague y, por lo tanto, dejará de chuparse el dedo.
 Castigo o castigo positivo: consiste en introducir de manera contingente, es decir,
inmediatamente ante una respuesta, un estímulo aversivo (desagradable, molesto)
 Un estímulo aversivo es aquel percibido como desagradable o molesto; un
estímulo nocivo es aquel que causa un daño en el sujeto.
 Costo de respuesta o castigo negativo: en este caso, el sujeto pierde algo agradable,
pierde privilegios.
Ejemplo: un niño se porta mal y como castigo no va a ver televisión/no va al parque/no va
a comer dulces/no vas a jugar play.
 Sobre-corrección (restitutiva o de práctica positiva): implica la repetición de una conducta
hasta extinguir la conducta inadecuada o no deseada por excesiva repetición.
1. Restitutiva: tiene por objetivo que el ambiente en el cual se presentó la conducta
inadecuada quede como estaba (estado original).
Ejemplo: un alumno ensucia el salón. El profesor le indica que, al finalizar la clase,
deberá quedarse a limpiar el salón y dejarlo limpio.
Ejemplo: las sillas deben quedar ordenadas. Cuando el estudiante no obedece la
instrucción, al finalizar la clase, deberá ordenar todas las sillas del salón.
Indicándole el por qué debe hacerlo.
2. Práctica positiva: implica realizar el comportamiento de manera reiterada hasta
que se haga de manera adecuada.
Ejemplo: caligrafía. Cuando el niño tiene la letra que no se entiende, practica
caligrafía múltiples veces hasta que modifique su escritura y se haga entendible.
Ejemplo: abotonarse la camisa. El papá hace que el niño se abotone múltiples
veces la camisa hasta que lo haga de manera adecuada.
 Saciedad: el estímulo reforzante se presenta tantas veces, de manera reiterada, que
pierde su valor reforzante.
Ejemplo: a una estudiante le gustaba una determinada torta (tres leches). Para su
cumpleaños decidió no compartirla porque era su sabor favorito, por lo que se le hizo
comer casi toda la torta ella sola, hasta que no pudo comer más. En la actualidad, cada vez
que ve esa torta, le dan sensaciones de fatiga y nauseas.
Ejemplo: un adolescente fumador. Fuma tanto que luego el sabor le causa desagrado.

Técnicas para incrementar conductas: (diapositivas).

Economía de fichas: consiste en ir acumulando una serie de elementos ara obtener al final un
refuerzo. Esta debe caracterizarse porque siempre se gane algo o no se gane nada; sin embargo,
nunca se pierde. El refuerzo debe ser algo muy significativo para el sujeto.

Ejemplo: acomodar la cama. Se va marcando por la cantidad de días realizados (se acumula). Al
final de la semana, si ha cumplido con todos los días, se le premia.

 Se pueden instaurar varias conductas.


 Nunca se pierde lo ya ganado. No se le retiran los premios que ya ganó.

Contrato conductual: es un acuerdo entre dos (2) personas donde se establece la conducta que se
quiere y el beneficio que se va a obtener.

 Ambos deben firmar.


 Se debe cumplir con lo prometido.

Ejemplo: se le dice que niño que, si realiza su tarea todos los días, al finalizar la semana se le dará
un permio.

Fenómenos asociados al Condicionamiento Operante: (diapositivas).

Adquisición: hace referencia a que el sujeto ha aprendido una nueva conducta, hay un aumento de
la probabilidad de que se produzca una determinada respuesta. Adquisición en el repertorio
conductual. Ejemplo: el aprender a amarrarse los zapatos, abotonarse la camisa.

Extinción: existe una disminución de la probabilidad de que una conducta ocurra por la no
presentación de un refuerzo. Ejemplo: la rata aprendió a presionar la palanca. Si esta continúa
presionando la palanca, pero deja de recibir refuerzo, entonces esta conducta va a disminuir o
extinguirse.

Discriminación del estímulo: existe una distinción de los estímulos. Ejemplo: la luz de el semáforo.
Existe una discriminación según el momento en el que se presente el estímulo; si en la noche
vemos la luz roja, se tiene tendencia a no detenerse, contrario a si se presenta en el día (existe una
generalización de la respuesta.

Generalización del estímulo: cuando se presenta un estímulo similar al original, se emitirá la


respuesta de la primera.

Contraste conductual: fenómeno que se presenta producto del aprendizaje de dos conductas
frente a dos estímulos discriminativos diferentes. Dependiendo del estímulo, se emiten
determinadas conductas. Ejemplo: luz del semáforo.

También podría gustarte