Modelo ERC de Alderfer
Modelo ERC de Alderfer
Modelo ERC de Alderfer
Índice
1Primeras investigaciones
2Procedimientos de condicionamiento
3Tipos de refuerzos
4Fases del condicionamiento operante
5Programas de reforzamiento
6Distinción entre condicionamiento clásico y operante
7Bibliografía
Primeras investigaciones[editar]
El psicólogo Edward Thorndike (1874-1949) fue uno de los pioneros en el estudio del
condicionamiento instrumental. Para ello, ideó sus denominadas «cajas de solución de
problemas», que eran jaulas de las que las ratas (que eran los animales con los que
trabajaba) podían escapar mediante acciones simples como manipular un cordón,
presionar una palanca o pisar una plataforma. Como incentivo para resolver el problema,
la rata podía ver y oler que fuera de la caja había comida, pero no podía alcanzarla. Al
principio, la rata comenzaba a hacer movimientos azarosos, hasta que casualmente
resolvía el problema, por ejemplo tirando de la polea que abría la jaula. Sin embargo, cada
vez que Thorndike metía a la rata en la jaula, tardaba menos en salir. Esto se debía a que
se estaba produciendo un condicionamiento operante: la conducta de tirar de la polea
estaba siendo reforzada por su consecuencia (la apertura de la caja y la obtención de la
comida). Esta conducta, al ser reforzada, se convertía en la conducta más probable en un
futuro cuando las circunstancias eran similares.
Caja de Skinner
A partir de estos experimentos, Thorndike estableció un principio que denominó Ley del
efecto: «Cualquier conducta que en una situación produce un efecto satisfactorio, se hará
más probable en el futuro». Si la respuesta va seguida de una consecuencia satisfactoria,
la asociación entre el estímulo y la respuesta se fortalece; si a la respuesta le sigue una
consecuencia desagradable, la asociación se debilita. En otras palabras, Thorndike
defendía que todos los animales, incluyendo al ser humano, resuelven los problemas
mediante el aprendizaje por ensayo y error.
También los estudios de Pávlov sobre condicionamiento clásico tuvieron una gran
influencia en el estudio del condicionamiento operante. Si bien se trata de procesos de
aprendizaje diferentes, el condicionamiento clásico y el operante comparten varios de sus
principios, como la adquisición, la extinción, la discriminación o la generalización.
El autor más importante en el estudio del condicionamiento operante es B. F. Skinner. A
finales de la década de 1920 empezó a trabajar con palomas. Para ello, utilizaba un
ambiente libre de distracciones denominado caja de Skinner, en el que se podían
manipular las condiciones en las que se proporcionaba alimento a los animales. Sus
exhaustivos estudios utilizando este artefacto permitieron a Skinner descubrir muchos de
los factores que influyen en el condicionamiento operante.
Procedimientos de condicionamiento[editar]
Existen cuatro procedimientos o tipos de condicionamiento instrumental:
Tipos de refuerzos[editar]
Lo que es o no es un refuerzo durante el condicionamiento operante depende del individuo
y de las circunstancias en que se encuentra en ese momento. Por ejemplo, unas galletas
pueden suponer un refuerzo para un perro hambriento, pero no para uno que acaba de
comer carne.
Los refuerzos se pueden dividir en dos grandes grupos: los primarios o intrínsecos y los
secundarios o extrínsecos.
Programas de reforzamiento[editar]
Los programas de reforzamiento son reglas que indican el momento y la forma en que la
aparición de la respuesta va a ir seguida de un reforzador sobre la administración del
reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la
rapidez con la que se aprende inicialmente la respuesta, la frecuencia con la que se
ejecuta la respuesta aprendida, la frecuencia con la que se hacen las pausas después de
los reforzamientos, o el tiempo que se sigue ejecutando la respuesta una vez que el
refuerzo deja de ser predecible o se suspende.
Existen dos tipos básicos de reforzamiento: el reforzamiento continuo y el reforzamiento
intermitente. En el reforzamiento continuo cada una de las respuestas da lugar a la
aparición de un reforzador, como en el caso de una paloma que recibe comida cada vez
que picotea una tecla. Este tipo de reforzamiento parece ser el modo más eficaz para
condicionar inicialmente la conducta. Sin embargo, cuando el refuerzo cesa (por ejemplo,
cuando desconectamos la entrega de alimento) la extinción también es rápida. Por su
parte, en el reforzamiento intermitente las respuestas solo se refuerzan algunas veces,
como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio
cada varias jugadas. Este tipo de programa produce un patrón más persistente de
respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible o
cesa. Una combinación de reforzamiento intermitente y de refuerzo continuo es muy eficaz
cuando se trata de enseñar a los sujetos mediante condicionamiento operante: al principio
se utiliza un reforzamiento continuo, para que se adquiera la respuesta, y luego se pasa a
un reforzamiento intermitente, para que sea más difícil que se extinga.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser
de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del
tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.
Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad
de tiempo, siempre que durante el intervalo se haya dado la respuesta. Un ejemplo
sería el de un padre que verifica cada media hora que su hijo está estudiando, y
cuando es así le hace un halago. Los programas de intervalo fijo producen una tasa de
respuestas desigual. Una vez que se administra el refuerzo, la tasa de respuestas
tiende a ser baja. Durante el intervalo, la conducta aumenta típicamente hasta
alcanzar un nivel elevado inmediatamente antes del siguiente reforzador programado.
La cantidad global de respuestas en un programa de intervalos fijos es moderada.
Por su parte, Edward Thorndike introdujo la ley del efecto, el antecedente más
claro del condicionamiento operante. La ley del efecto plantea que si una
conducta tiene consecuencias positivas para quien la realiza será más probable
que se repita, mientras que si tiene consecuencias negativas esta probabilidad
disminuirá. En el contexto de la obra de Thorndike el condicionamiento
operante es denominado “instrumental”.
Consecuencia
En la psicología conductista y cognitivo-conductual una consecuencia es el
resultado de una respuesta. La consecuencia puede ser positiva (refuerzo) o
negativa (castigo) para el sujeto que lleve a cabo la conducta; en el primer
caso la probabilidad de que se dé la respuesta aumentará y en el segundo
disminuirá.
Reforzamiento
Este término designa las consecuencias de las conductas cuando hacen más
probable que se vuelvan a dar. El reforzamiento puede ser positivo, en cuyo
caso estaremos hablando de la obtención de una recompensa o premio por la
ejecución de una respuesta, o negativo, que engloba la desaparición de
estímulos aversivos.
Por ejemplo, un cartel de “Abierto” en una puerta nos indica que si intentamos
girar el pomo lo más probable es que se abra. En este caso el cartel sería el
estímulo discriminativo y la apertura de la puerta funcionaría como reforzador
positivo de la respuesta instrumental de girar el pomo.
1. Técnicas de instigación
Se consideran técnicas de instigación aquellas que dependen de la
manipulación de estímulos discriminativos para aumentar la probabilidad
de que se dé una conducta.
2. Moldeamiento
Consiste en acercar gradualmente una conducta determinada a la conducta
objetivo, empezando por una respuesta relativamente parecida que el sujeto
pueda realizar y modificándola poco a poco. Se lleva a cabo por pasos
(aproximaciones sucesivas) a los que se aplica reforzamiento.
El moldeamiento es considerado especialmente útil para establecer conductas
en sujetos que no se pueden comunicar verbalmente, como las personas con
discapacidad intelectual profunda o los animales.
3. Desvanecimiento
El desvanecimiento se refiere a la retirada gradual de las ayudas o
instigadores que se habían utilizado para reforzar una conducta meta. Se
pretende que el sujeto consolide una respuesta y posteriormente pueda llevarla
a cabo sin necesidad de ayudas externas.
4. Encadenamiento
Una cadena conductual, es decir, una conducta compuesta por varias
conductas simples, se separa en distintos pasos (eslabones). A continuación el
sujeto debe aprender a ejecutar los eslabones uno a uno hasta lograr llevar a
cabo la cadena completa.
5. Programas de reforzamiento
En un procedimiento de aprendizaje operante, los programas de reforzamiento
son las pautas que establecen cuándo será premiada la conducta y cuándo
no.
Ambos tipos de programa pueden ser fijos o variables, lo cual indica que el
número de respuestas o el intervalo de tiempo necesarios para la obtención del
reforzador pueden ser constantes u oscilar en torno a un valor promedio.
También pueden ser continuos o intermitentes; esto significa que la
recompensa puede darse cada vez que el sujeto lleve a cabo la conducta
objetivo o bien de vez en cuando (aunque siempre como consecuencia de una
emisión de la respuesta deseada).
1. Extinción
Se deja de recompensar una conducta que había sido reforzada con
anterioridad. Esto disminuye la probabilidad de que la respuesta vuelva a
darse. Formalmente la extinción es lo opuesto al reforzamiento positivo.
2. Entrenamiento de omisión
En este procedimiento, a la conducta del sujeto le sigue la ausencia de la
recompensa; es decir, si se da la respuesta no se obtendrá el reforzador. Un
ejemplo del entrenamiento de omisión podría ser que unos padres impidan a
su hija ver la televisión esa noche por haberles hablado de forma irrespetuosa.
Otro ejemplo sería el hecho de no ir a comprar los juguetes que los niños
piden, si estos se portan mal.
En ámbitos educativos, además, sirve para favorecer que se valoren más los
esfuerzos que otras personas hacen para contentar a los pequeños y que
estos, al haberse acostumbrado a estos tratos, no valoran.
4. Coste de respuesta
Variante del castigo negativo en que la ejecución de la conducta problema
provoca la pérdida de un reforzador. El carnet de puntos para conductores
que se introdujo en España hace unos años es un buen ejemplo de programa
de coste de respuesta.
5. Tiempo fuera
El tiempo fuera consiste en aislar al sujeto, en general niños, en un entorno no
estimulante en caso de que se produzca la conducta problemática. También
una variante del castigo negativo, se diferencia del coste de respuesta en
que lo que se pierde es la posibilidad de acceder al refuerzo, no el
reforzador en sí.
6. Saciación
El refuerzo que se obtiene por llevar a cabo la conducta es tan intenso o
cuantioso que pierde el valor que tenía para un sujeto. Esto puede tener lugar
por saciación de respuesta o práctica masiva (repetir la conducta hasta que
deje de ser apetitiva) o bien por saciación de estímulo (el reforzador pierde su
apetitividad por exceso).
7. Sobrecorrección
La sobrecorrección consiste en aplicar un castigo positivo relacionado con la
conducta problema. Por ejemplo, es muy utilizada en casos de enuresis, en
que se pide al niño que lave las sábanas después de orinarse encima durante la
noche.
Referencias bibliográficas:
Los estudios sobre el condicionamiento clásico dieron lugar a la aparición de otras teorías
que pueden explicar el comportamiento y el aprendizaje, y una de ellas es el
condicionamiento operante. El condicionamiento operante trata de negar la creencia de
que los pensamientos y motivaciones internas son los responsables del aprendizaje de un
comportamiento. Como conductista, Skinner creía que sólo las causas externas de
comportamiento debían ser consideradas.
El término "operante" fue utilizado por Skinner con el fin de darnos una buena visión
general de su teoría. Con este término, él quería decir que este tipo de condicionamiento
implica sólo los factores externos que afectan al comportamiento y sus consecuencias.
A. Refuerzo
El refuerzo es un proceso de incrementación de la frecuencia o tasa de ocurrencia de una
determinada conducta, por medio de un estímulo presentado poco después de su
manifestación. Al evento que intensifica la probabilidad de que el comportamiento se
repita se le denomina reforzador. Existen dos tipos de refuerzo:
Tanto con los refuerzos positivos como con los negativos, el comportamiento es
incrementado.
B. Castigo
En contraste con el refuerzo, el castigo es un proceso en el que un estímulo es dado
después de la presentación de un comportamiento causando la disminución de la
probabilidad de que éste ocurra nuevamente. Hay dos tipos de castigos:
Ejemplo: Un niño molestó a su hermana haciéndola gritar muy alto. Debido a esto, la
madre le dio una nalgada. El niño nunca molestó otra vez a su hermana.
2. Castigo negativo, por otro lado, es la eliminación de algo que es favorable, con
el fin de disminuir la probabilidad de que vuelva a ocurrir ese comportamiento.
Para tener una mejor comprensión de estos conceptos, aquí hay una tabla que resume
las características del refuerzo positivo / negativo y el castigo positivo / negativo: