Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Modelo ERC de Alderfer

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 25

Modelo ERC de Alderfer

A pesar del éxito general del modelo de Maslow, se le ha achacado su excesiva


delimitación de necesidades, por entender que en la práctica no resulta sencillo distinguir
entre los diferentes niveles de la jerarquía. Y si los niveles de necesidades no pueden ser
diferenciados, se prevén enormes dificultades para que quienes dirigen el trabajo logren
identificar en cuál de ellos se encuentra cada uno de sus subordinados. En atención a esta
crítica, y de acuerdo con un estudio realizado entre directivos en el que se pone en
entredicho la existencia de dicha jerarquía 35 , Clayton Alderfer propuso reformular el
modelo de Maslow y reducir a sólo tres las clases de necesidades 36 . Estas nuevas
clases agrupan, de otra manera, las categorías de Maslow: 1) La conservación de la
existencia física (E): necesidades fisiológicas y de seguridad. 2) El mantenimiento de las
relaciones interpersonales (R): necesidades de autoestima y pertenencia. 3) La posibilidad
de crecimiento personal (C): necesidades de estima y autorrealización. Como se ve, este
enfoque, conocido como Teoría ERC, es casi idéntico al de Maslow (vid. Fig. 5.2). Su
sencillez le ha otorgado gran popularidad en la práctica empresarial. Reconoce la
existencia de varios tipos de necesidades, aunque sin ordenarlas jerárquicamente y
admitiendo que cualquiera de ellas puede ser activada sin esperar a que las de orden
inferior hayan sido satisfechas 3? . En compensación, formula una serie de proposiciones
que sugieren que: cuanto menos satisfecha está una necesidad, más se desea su
satisfacción; cuanto menos satisfecha está una necesidad superior, más se desea la
satisfacción completa de sus inferiores; cuanto más satisfecha está una necesidad, más se
desea pasar a satisfacer sus superiores; cuanto más satisfechas están las necesidades de
crecimiento, más aumenta su intensidad.
A pesar de que los resultados de los estudios recientes tienden a ajustarse más a esta
teoría que a la de la jerarquía, el modelo ERC de Alderfer ha recibido poco apoyo por parte
de los investigadores. No cabe considerarla, por consiguiente, como una alternativa sólida
a la popularísima jerarquía de Maslow.
Análisis bifactorial de Herzberg

Frederick Herzberg, contemporáneo de Maslow y psicólogo clínico como él, ha dedicado


gran parte de su vida a trasladar al ámbito de la empresa sus conocimientos sobre la
conducta humana. Fue la guerra la que le proporcionó la ocasión de acceder al
conocimiento de la parte más cruel del ser humano, puesto que le tocó formar parte del
grupo de soldados aliados que liberó el campo de Dachau. Lo que allí vio le impresionó de
tal manera que no pudo dejar de preguntarse por las causas y motivos que llevan a las
personas a obrar tan descabelladamente: «El núcleo central de mi obra -explica en una
reciente entrevistaderiva de mis experiencias en el campo de concentración de Dachau, al
término de la Segunda Guerra Mundial, donde comprendí que una sociedad pierde la
razón cuando empuja a sus miembros a la sinrazón» 25 . La satisfacción en el trabajo Con
esa preocupación por el desgarramiento mental de toda una sociedad, volvió sus ojos a las
estrategias para conservar la salud de los todavía sanos, en una sociedad cuyo pulso vital
gira en torno a las fábricas: «Decidí fijarme en los mentalmente sanos, en los que al menos
funcionan, no con intención de aliviar los males de la industria, sino con la de preservar la
salud de los que viven en ella. ¿Cómo evitar que los sanos caigan enfermos?» 26 .
Coincide, por tanto, con Maslow en la idea de partir del análisis de los individuos sanos, en
lugar de estudiar las patologías, como era tradicional en las investigaciones clínicas. Dirige
su atención a las organizaciones empresariales por considerarlas las mejor capacitadas
para cambiar la situación. Herzberg salta a la fama en 1959 con la publicación, en
compañía de B. Mausner y B. S. Snyderman, de The Motivation to Work 27 En esta obra
sacan a la luz los resultados de las investigaciones realizadas entre ingenieros y contables
de nueve empresas seleccionadas en el área de Pittsburg. Los autores pretendieron un
doble objetivo: 1) dilucidar cuáles eran los factores que causaban la satisfacción o la
insatisfacción entre los empleados; y 2) medir la repercusión que tanto la satisfacción
como la insatisfacción tenían en el rendimiento laboral. Para lograrlo, basaron su estudio
en doscientas entrevistas semi-estructuradas, en las que se solicitaba la mención de
ocasiones en las que los protagonistas se habían sentido especialmente contentos en su
trabajo, así como de aquellas otras en que se habían sentido insatisfechos. Además, se
les pidió que tratasen de evaluar si esas percepciones, positivas o negativas, habían
influido de alguna forma en su rendimiento o en su bienestar. Los resultados obtenidos
sugerían que las situaciones conducentes a la satisfacción pertenecen a una categoría
completamente diferente de las causantes de insatisfacción. Cuando los entrevistados
relataban hechos que les habían despertado sentimientos de satisfacción, estaban
describiendo acontecimientos característicos de la tarea que realizaban; mientras que
cuando mencionaban situaciones de insatisfacción, se referían a sucesos pertenecientes
al entorno, es decir, externos a la tarea misma. Dos tipos de factores De ahí se derivó la
principal conclusión del estudio: la teoría bifactorial. Proclama ésta que los factores que
causan satisfacción son diferentes de los que producen insatisfacción. De lo que se
deduce que el polo opuesto a la satisfacción laboral no es la insatisfacción, sino la "no-
satisfacción"; paralelamente, lo opuesto a la insatisfacción no es la satisfacción, sino la
"no-insatisfacción". A los factores que producen insatisfacción se les bautizó con el nombre
de "factores higiénicos", puesto que su ausencia provoca insatisfacción, pero su presencia
deja la situación "limpia": ni satisfacción ni insatisfacción. Estos factores higiénicos serían,
por orden de importancia: la política de la compañía, la supervisión, las relaciones con
superiores, las condiciones de trabajo, el salario, etc. No se trata de aspectos que motiven
positivamente hacia el trabajo, aunque sí pueden provocar desmotivación si no se dan en
la medida requerida. Por el contrario, los "factores de crecimiento" hacen referencia al
trabajo en sí, esto es, al contenido mismo de la tarea que se lleva a cabo, y curiosamente
son los que más animan a trabajar. Luego el contenido de la tarea será el principal factor
motivador. Debe advertirse que ni estos factores ni tampoco los de higiene se dan en
estado puro, sino que siempre se observa una combinación de todos ellos. No obstante, se
mantiene la tesis de que los factores motivadores, como la realización y el reconocimiento,
por ejemplo, producen gran satisfacción, pero sus contrarios producen muy poca
insatisfacción. Con la política de la empresa o la supervisión -factores higiénicos ocurre al
contrario: por muy bien que se lleven no provocan satisfacción, lo más que se puede
esperar es que no originen insatisfacción (vid. Fig. 5.1). Este descubrimiento dio pie a la
técnica del job enrichment, que ha tenido gran predicamento en el ámbito directivo durante
las últimas décadas. Consiste este "enriquecimiento" en fomentar la responsabilidad del
empleado en su propia labor, suprimir determinados controles, proporcionar cierta
autoridad y autonomía en su puesto, asignar una unidad de trabajo que permita al
empleado contemplar sus propios resultados, informarle de su nivel de desempeño y
confiarle nuevas tareas que rompan la monotonía. Lógicamente, la aplicación de esta
técnica debe efectuarse con cuidado, para evitar el error de confundir el enriquecimiento
vertical con la ampliación horizontal de la tarea. Se trata de aumentar el atractivo del
trabajo, no su cantidad. El concepto ha sido muy discutido y ha producido numerosos
frutos, pero también algunos fracasos 28 . Una de sus virtudes ha sido la de alentar una
nueva concepción de las relaciones laborales, que se concreta en la presencia de algunas
tendencias universalmente difundidas: la conveniencia de formación permanente para
todos los miembros de la organización, la necesidad de romper con la monotonía, la
consideración del llamado "cliente interno", la atención al clima organizacional, las
fórmulas de participación y democracia industrial, etc. El artículo más difundido de
Herzberg sobre la motivación apareció en la Harvard Business Review en 1968, su título:
"One more time: How do you motívate employees?" 29 . Se trata de un escrito de tono
desenfadado y humorístico, pero a la vez muy claro y estructurado. Ha supuesto el récord
de ventas de toda la historia de la revista de Harvard: se calcula que se han impreso cerca
de un millón y medio de ejemplares. En él. Herzberg se plantea cuál es la forma más
sencilla de lograr que alguien haga algo. ¿Pedírselo?, ¿ordenárselo?, ¿ofrecerle dinero?,
¿enseñarle a hacerlo? Todas esas estrategias son complicadas, costosas y poco fiables.
La manera más segura y sencilla consiste en lo que Herzberg llama KITA, siglas de "kick in
the ass" (patada en el trasero). Existen varias clases de KITA. El más inmediato es el
"KITA físico negativo", muy utilizado en el pasado, pero con serios inconvenientes: carece
de elegancia, choca con la imagen humanizada que pretenden dar las empresas y además
el trabajador puede devolver la patada. Estas desventajas se superan con el "KITA
psicológico negativo", pero -y es uno de los grandes descubrimientos de Herzbergsu
empleo manifiesta que quien lo ejecuta es en realidad el único que resulta motivado; el que
recibe el empujón psicológico permanece pasivo, sólo es movido desde fuera. Por tanto, el
KITA negativo produce movimiento pero no motivación. Tampoco está la solución en el
"KITA positivo" -incentivos materiales-, pues con él ocurre algo similar: «Tengo un
Schnauzer de un año... Ahora que ha acabado su período de entrenamiento, le muestro
una galleta para perros cuando quiero que se mueva. En este caso, ¿quién resulta
motivado: el perro o yo? El perro quiere la galleta, pero soy yo quien desea que él se
mueva. Otra vez soy yo el motivado y el perro es el que se mueve» 30 . Similares a éstos
son los procedimientos "motivadores" tradicionalmente utilizados en la industria,
procedentes de la visión conductista que subyace en el taylorismo. Herzberg rechaza
tajantemente considerarlos motivación, puesto que sólo son puntapiés, que empujan o
atraen, de acuerdo con el viejo sistema del palo y la zanahoria, pero no logran que el
individuo realmente quiera hacer las cosas. Con sus ejemplos y su peculiar terminología,
Herzberg pretende llamar la atención sobre el tratamiento animal que a veces se da a las
relaciones humanas. La solución, a su juicio, pasa por instalar un "generador" de
movimiento en el propio trabajador, en lugar de estar tratando de recargarle las baterías
desde fuera mediante estímulos externos. A esta propuesta de Herzberg más tarde se le
aplicaría el nombre de "automotivación". El generador, como es obvio, lo constituyen los
"factores de crecimiento", intrínsecos al puesto: el contenido del trabajo, lo logrado, el
reconocimiento de esos logros, la responsabilidad y el progreso profesional. No existe un
modo científico e infalible para lograrlo: debe procurarse aumentar la formación, hacerla
permanente, adelantarla, hacer partícipes del producto total, etc. Sólo quien sabe
realmente lo que hace en su trabajo y las repercusiones que tiene puede verdaderamente
querer hacerlo.
Repercusiones de los hallazgos de Herzberg

Probablemente la principal aportación de Herzberg ha consistido en abrir un nuevo


panorama a partir de su idea de la motivación como algo interno a la obra misma. Su tono
positivo, de atención a las oportunidades de crecimiento y mejora, ha descubierto un
nuevo sentido del trabajo: para que un empleado se manifieste satisfecho y motivado no
basta con que las condiciones del entorno sean adecuadas, se precisa que la tarea sea en
sí misma interesante, variada y fuente de retos. Supone, junto con Maslow y sus
continuadores, un paso adelante frente al embrollo de las explicaciones de sesgo
mecanicista. Ha colocado a los incentivos económicos en su lugar: si protestan por el
salario, en el momento en que se les aumente dejarán de estar insatisfechos, pero no por
eso estarán más motivados para esforzarse. Debe proporcionarse al trabajador cierto nivel
de autonomía, responsabilidad y autocontrol, de forma que pueda satisfacer sus
necesidades de logro, competencia y autorrealización. El job enrichment aspira a
proporcionar soluciones en esta línea, aunque frecuentemente haya de superar obstáculos
procedentes de los propios operarios: «Los intelectuales piensan que el que hace una silla
es más feliz que el que solamente hace el torneado de los barrotes. Durante cinco años,
yo ejecuté tareas completas y tareas fraccionadas. No pienso que eso sea verdad. En la
cadena, lo que cuenta es la cadencia, el ambiente, el olor, el calor.
Condicionamiento operante
El condicionamiento operante es una forma de enseñanza, mediante la cual un sujeto
tiene más probabilidades de repetir las formas de conducta que conllevan consecuencias
positivas y menos probabilidad de repetir las que conllevan problemas negativos. Es un
tipo de aprendizaje asociativo, este tiene que ver con el desarrollo de nuevas conductas en
función de sus consecuencias, y no con la asociación entre estímulos y conductas como
ocurre en el condicionamiento clásico.
El término fue introducido por el Psicólogo Burrhus Frederic Skinner, aunque hoy se
prefiere el de «condicionamiento instrumental», introducido por Edward Thorndike, por ser
más descriptivo. Este último sugiere que la conducta sirve de instrumento para conseguir
un fin y se da por ensayo y error, a diferencia del condicionamiento operante planteado por
Skinner, que propone que aquellas respuestas que se vean reforzadas tienen tendencia a
repetirse y aquellas que reciban un castigo tendrán menos probabilidad de repetirse.
La investigación sobre el condicionamiento operante ha dado lugar a una tecnología muy
minuciosa para la enseñanza, denominada modificación de conducta.

Índice

 1Primeras investigaciones
 2Procedimientos de condicionamiento
 3Tipos de refuerzos
 4Fases del condicionamiento operante
 5Programas de reforzamiento
 6Distinción entre condicionamiento clásico y operante
 7Bibliografía

Primeras investigaciones[editar]
El psicólogo Edward Thorndike (1874-1949) fue uno de los pioneros en el estudio del
condicionamiento instrumental. Para ello, ideó sus denominadas «cajas de solución de
problemas», que eran jaulas de las que las ratas (que eran los animales con los que
trabajaba) podían escapar mediante acciones simples como manipular un cordón,
presionar una palanca o pisar una plataforma. Como incentivo para resolver el problema,
la rata podía ver y oler que fuera de la caja había comida, pero no podía alcanzarla. Al
principio, la rata comenzaba a hacer movimientos azarosos, hasta que casualmente
resolvía el problema, por ejemplo tirando de la polea que abría la jaula. Sin embargo, cada
vez que Thorndike metía a la rata en la jaula, tardaba menos en salir. Esto se debía a que
se estaba produciendo un condicionamiento operante: la conducta de tirar de la polea
estaba siendo reforzada por su consecuencia (la apertura de la caja y la obtención de la
comida). Esta conducta, al ser reforzada, se convertía en la conducta más probable en un
futuro cuando las circunstancias eran similares.

Caja de Skinner
A partir de estos experimentos, Thorndike estableció un principio que denominó Ley del
efecto: «Cualquier conducta que en una situación produce un efecto satisfactorio, se hará
más probable en el futuro». Si la respuesta va seguida de una consecuencia satisfactoria,
la asociación entre el estímulo y la respuesta se fortalece; si a la respuesta le sigue una
consecuencia desagradable, la asociación se debilita. En otras palabras, Thorndike
defendía que todos los animales, incluyendo al ser humano, resuelven los problemas
mediante el aprendizaje por ensayo y error.
También los estudios de Pávlov sobre condicionamiento clásico tuvieron una gran
influencia en el estudio del condicionamiento operante. Si bien se trata de procesos de
aprendizaje diferentes, el condicionamiento clásico y el operante comparten varios de sus
principios, como la adquisición, la extinción, la discriminación o la generalización.
El autor más importante en el estudio del condicionamiento operante es B. F. Skinner. A
finales de la década de 1920 empezó a trabajar con palomas. Para ello, utilizaba un
ambiente libre de distracciones denominado caja de Skinner, en el que se podían
manipular las condiciones en las que se proporcionaba alimento a los animales. Sus
exhaustivos estudios utilizando este artefacto permitieron a Skinner descubrir muchos de
los factores que influyen en el condicionamiento operante.

Procedimientos de condicionamiento[editar]
Existen cuatro procedimientos o tipos de condicionamiento instrumental:

 Refuerzo positivo o condicionamiento de recompensa: Un refuerzo positivo es un


objeto, evento o conducta cuya presencia incrementa la frecuencia de la respuesta por
parte del sujeto. Se trata del mecanismo más efectivo para hacer que tanto animales
como humanos aprendan. Se denomina «refuerzo» porque aumenta la frecuencia de
la conducta, y «positivo» porque el refuerzo está presente. Refuerzos positivos típicos
son las alabanzas, los regalos o las aportaciones monetarias. Sin embargo, hay que
tener en cuenta que en ocasiones algo que ordinariamente se considera desagradable
puede funcionar como refuerzo positivo, ya que de hecho incrementa la probabilidad
de la respuesta (como cuando se grita a un niño ante una rabieta, y este se siente
reforzado porque así llama la atención).
 Refuerzo negativo: Un refuerzo negativo es un objeto, evento o conducta cuya
retirada incrementa la frecuencia de la respuesta por parte del sujeto. Al igual que el
anterior, se denomina «refuerzo» porque aumenta la frecuencia de la conducta, pero
«negativo» porque la respuesta se incrementa cuando el refuerzo desaparece. En el
refuerzo negativo se pueden distinguir dos procedimientos:
o Condicionamiento de escape: En este caso, la frecuencia de una respuesta
aumenta porque interrumpe un estímulo aversivo, es decir, un suceso que está
ocurriendo y que el sujeto considera desagradable. Un ejemplo típico sería el de
un animal que aprieta una palanca porque así elimina una corriente eléctrica o el
de un padre que le compra una chuchería a su hijo para dejar de oírle llorar.
o Condicionamiento de evitación: En este caso, la frecuencia de una respuesta
aumenta porque pospone o evita un estímulo aversivo futuro. Un ejemplo típico
sería el de un alumno que estudia para evitar una mala nota.
 Entrenamiento de omisión: Se produce cuando la respuesta operante impide la
presentación de un refuerzo positivo o de un hecho agradable; es decir, consiste en
retirar el estímulo positivo de una conducta para así provocar la extinción de la
respuesta. Un ejemplo importante es el de «tiempo fuera», en el que se retira la
atención de un niño aislándolo durante un cierto período de tiempo.
 Castigo: El castigo provoca la disminución de una conducta porque el suceso que la
sigue es un estímulo aversivo. Un ejemplo típico es castigar a una rata con una
pequeña corriente eléctrica cuando pulsa una palanca. Aunque el castigo puede ser en
ocasiones muy eficaz para hacer que desaparezca una conducta, se recomienda
utilizarlo lo menos posible, ya que tiene muchos efectos adversos o no deseados. En
muchas ocasiones la conducta solo desaparece temporalmente o únicamente en los
contextos en los que es probable el castigo. Además, genera gran cantidad de
consecuencias secundarias (como frustración, agresividad, etc.) que pueden hacer
que se detenga el proceso de aprendizaje. Por eso, en la aplicación de castigos es
importante seguir ciertas reglas, como reforzar al mismo tiempo conductas alternativas
a la castigada, aplicarlo inmediatamente después de la conducta que se quiere
suprimir, o ser constante (ya que castigar una conducta solo a veces produce un
efecto contrario al que se desea).

Tipos de refuerzos[editar]
Lo que es o no es un refuerzo durante el condicionamiento operante depende del individuo
y de las circunstancias en que se encuentra en ese momento. Por ejemplo, unas galletas
pueden suponer un refuerzo para un perro hambriento, pero no para uno que acaba de
comer carne.
Los refuerzos se pueden dividir en dos grandes grupos: los primarios o intrínsecos y los
secundarios o extrínsecos.

 Se dice que un reforzador es primario o intrínseco cuando la respuesta es reforzante


por sí misma, es decir, cuando la respuesta es en sí una fuente de sensaciones
agradables y la acción se fortalece automáticamente cada vez que ocurre. Existen
varios tipos de conductas que son intrínsecamente reforzantes. Por ejemplo, las
respuestas que satisfacen necesidades fisiológicas, como beber cuando se tiene sed o
comer cuando se tiene hambre, son intrínsecamente agradables para la mayoría de
los organismos. Muchas actividades sociales o que brindan estimulación sensorial o
intelectual son también con frecuencia intrínsecamente reforzantes, al igual que la
sensación de progreso en una habilidad. También pueden ser reforzantes por sí
mismas todas las conductas que ayudan a un organismo a evitar algún daño. Sin
embargo, las actividades intrínsecamente gratificadoras no siempre son reforzantes
desde el principio; por ejemplo, se necesita cierta habilidad antes de que una actividad
que requiere competencia (como tocar un instrumento musical, por ejemplo) se vuelva
inherentemente satisfactoria.

 Los refuerzos secundarios o extrínsecos son aprendidos, y en ellos el premio o


gratificación no es parte de la actividad misma, sino que obtienen su carácter de
refuerzo por asociación con los reforzadores primarios. Por ejemplo, las recompensas
monetarias se convierten en refuerzo porque permiten a su vez conseguir refuerzos
primarios. Un tipo de reforzadores extrínsecos especialmente importante, que pueden
influir enormemente cuando se trata de modificar la conducta humana, son
los reforzadores sociales como el afecto, la atención o la aprobación.
En la vida real, diversos reforzadores intrínsecos y extrínsecos se encuentran
habitualmente entremezclados en un mismo suceso reforzante.

Fases del condicionamiento operante[editar]


 Adquisición: La adquisición de la respuesta se refiere a la fase del aprendizaje en
que la respuesta es seguida por reforzadores. Durante la adquisición la respuesta se
vuelve más fuerte o más frecuente, debido a su relación con la consecuencia
reforzante.

 Generalización: Las respuestas fortalecidas mediante procedimientos operantes en


un conjunto de circunstancias tienden a extenderse o a generalizarse en situaciones
similares, al igual que ocurre en el condicionamiento clásico. Cuando más parecidos
sean los contextos, más probable es la generalización.
 Discriminación: Los individuos desarrollan también discriminaciones al reforzarse las
respuestas en una situación, pero no en otra.

 Extinción: Cuando se retira el reforzamiento para alguna respuesta particular, dicha


conducta disminuye su frecuencia gradualmente hasta que solo ocurre con la misma
frecuencia con que ocurría antes del reforzamiento. Sin embargo, es importante
advertir que en muchas ocasiones, después de que se retiren los reforzadores, se
advierte inicialmente un aumento de la cantidad de respuesta y de la frustración antes
de que empiece la disminución.

 Recuperación espontánea: Al igual que en el condicionamiento clásico, las


respuestas que se han extinguido vuelven a aparecer algunas veces, es decir, se da
una recuperación espontánea después de un descanso

Programas de reforzamiento[editar]
Los programas de reforzamiento son reglas que indican el momento y la forma en que la
aparición de la respuesta va a ir seguida de un reforzador sobre la administración del
reforzador. Estos programas influyen en distintos aspectos del aprendizaje, como la
rapidez con la que se aprende inicialmente la respuesta, la frecuencia con la que se
ejecuta la respuesta aprendida, la frecuencia con la que se hacen las pausas después de
los reforzamientos, o el tiempo que se sigue ejecutando la respuesta una vez que el
refuerzo deja de ser predecible o se suspende.
Existen dos tipos básicos de reforzamiento: el reforzamiento continuo y el reforzamiento
intermitente. En el reforzamiento continuo cada una de las respuestas da lugar a la
aparición de un reforzador, como en el caso de una paloma que recibe comida cada vez
que picotea una tecla. Este tipo de reforzamiento parece ser el modo más eficaz para
condicionar inicialmente la conducta. Sin embargo, cuando el refuerzo cesa (por ejemplo,
cuando desconectamos la entrega de alimento) la extinción también es rápida. Por su
parte, en el reforzamiento intermitente las respuestas solo se refuerzan algunas veces,
como en el caso de una persona que juega a las máquinas y recibe el refuerzo o premio
cada varias jugadas. Este tipo de programa produce un patrón más persistente de
respuestas que un programa continuo cuando el reforzamiento se vuelve impredecible o
cesa. Una combinación de reforzamiento intermitente y de refuerzo continuo es muy eficaz
cuando se trata de enseñar a los sujetos mediante condicionamiento operante: al principio
se utiliza un reforzamiento continuo, para que se adquiera la respuesta, y luego se pasa a
un reforzamiento intermitente, para que sea más difícil que se extinga.
El reforzamiento intermitente da lugar a los programas de reforzamiento, que pueden ser
de dos tipos: de razón (en función del número de respuestas) y de intervalo (en función del
tiempo). A su vez, cada uno de ellos admite dos tipos de administración: fija o variable.

 Razón fija: El refuerzo se obtiene después de un número fijo de respuestas. Un


ejemplo se da cuando las fábricas pagan a sus obreros después de producir un
determinado número de productos. En realidad, el reforzamiento continuo es un
programa de este tipo de razón 1. Los individuos responden con una tasa
relativamente mayor de respuestas cuando operan bajo programas de razón fija
superior a 1 (dependerá del caso aplicar la razón más adecuada), pero por lo general
hacen una pausa para descansar después de recibir el reforzamiento, antes de
proseguir con la respuesta.

 Razón variable: En este caso, el número de respuestas para conseguir el reforzador


varía aleatoriamente, aunque siempre dentro de un promedio determinado. Un ejemplo
son las máquinas tragamonedas, que están programadas para otorgar el premio
conforme a un programa de razón variable. Muchos reforzadores naturales, como el
éxito o el reconocimiento, se acercan mucho a este tipo de programas. Los programas
de razón variable producen una tasa de respuesta global elevada sostenida, y los
individuos no hacen pausa después del refuerzo. Aparentemente, la incertidumbre de
no saber cuándo va a llegar el siguiente reforzador mantiene a los organismos
produciendo la respuesta constantemente.

 Intervalo fijo: El refuerzo aparece cada vez que trascurre una determinada cantidad
de tiempo, siempre que durante el intervalo se haya dado la respuesta. Un ejemplo
sería el de un padre que verifica cada media hora que su hijo está estudiando, y
cuando es así le hace un halago. Los programas de intervalo fijo producen una tasa de
respuestas desigual. Una vez que se administra el refuerzo, la tasa de respuestas
tiende a ser baja. Durante el intervalo, la conducta aumenta típicamente hasta
alcanzar un nivel elevado inmediatamente antes del siguiente reforzador programado.
La cantidad global de respuestas en un programa de intervalos fijos es moderada.

 Intervalo variable: El refuerzo está disponible después de un tiempo que varía


aleatoriamente, pero alrededor de un promedio. Un ejemplo es el de un profesor que
realiza exámenes sorpresa aproximadamente cada semana. Este tipo de programa
por lo general produce una tasa de respuesta constante, pero moderada.
Por lo general, los programas de tasa (razón) producen una adquisición más rápida, pero
fácilmente extinguible una vez suspendida la administración de reforzadores; y los de
intervalo producen una adquisición más estable y resistente a la extinción. En la vida real,
estos programas básicos a menudo se combinan.

Distinción entre condicionamiento clásico y operante


 En el condicionamiento clásico la asociación se da entre un estímulo condicionado y
uno incondicionado. En el condicionamiento instrumental, la asociación se da entre las
respuestas y las consecuencias que se derivan de ellas.

 En el condicionamiento clásico, el estímulo incondicionado no depende de la


respuesta del sujeto, mientras que en el operante las consecuencias dependen de la
respuesta del sujeto.

 En el condicionamiento clásico, la respuesta del sujeto es involuntaria, mientras que


en el instrumental es generalmente voluntaria.
Condicionamiento operante:
conceptos y técnicas principales
Esta herramienta del conductismo es uno de los procedimientos más
usados en la Psicología actual.
por Alex Figueroba

Dentro de los procedimientos conductuales, el condicionamiento operante o


instrumental es probablemente el que tiene aplicaciones más numerosas y
variadas.

Desde el tratamiento de fobias hasta la superación de adicciones como


el tabaquismo o el alcoholismo, el esquema operante permite conceptualizar
y modificar prácticamente cualquier hábito a partir de la intervención sobre
unos pocos elementos.

Pero ¿en qué consiste exactamente el condicionamiento operante? En este


artículo repasamos los conceptos clave para entender este paradigma y
detallamos sus aplicaciones más frecuentes, tanto para aumentar conductas
como para reducirlas.

Antecedentes del condicionamiento operante


El condicionamiento operante tal y como lo conocemos fue formulado y
sistematizado por Burrhus Frederic Skinner en base a las ideas planteadas
previamente por otros autores.

Ivan Pavlov y John B. Watson habían descrito el condicionamiento clásico,


también conocido como condicionamiento simple o pavloviano.

Por su parte, Edward Thorndike introdujo la ley del efecto, el antecedente más
claro del condicionamiento operante. La ley del efecto plantea que si una
conducta tiene consecuencias positivas para quien la realiza será más probable
que se repita, mientras que si tiene consecuencias negativas esta probabilidad
disminuirá. En el contexto de la obra de Thorndike el condicionamiento
operante es denominado “instrumental”.

 Artículo relacionado: “Conductismo: historia, conceptos y autores


principales”

Diferencia entre condicionamiento clásico y operante


La diferencia principal entre el condicionamiento clásico y el operante es que
el primero se refiere al aprendizaje de información sobre un estímulo,
mientras que el segundo implica un aprendizaje sobre las consecuencias de
la respuesta.

Skinner opinaba que la conducta era mucho más fácil de modificar si se


manipulaban sus consecuencias que si simplemente se asociaban estímulos a
ésta, como sucede en el condicionamiento clásico. El condicionamiento
clásico se basa en la adquisición de respuestas reflejas, con lo cual explica una
menor cantidad de aprendizajes y sus usos son más limitados que los del
operante, ya que éste hace referencia a conductas que el sujeto puede controlar
a voluntad.

 Artículo relacionado: “El condicionamiento clásico y sus experimentos más


importantes”

Conceptos del condicionamiento operante


A continuación definiremos los conceptos básicos del condicionamiento
operante para entender mejor este procedimiento y sus aplicaciones.

Muchos de estos términos son compartidos por las orientaciones conductuales


en general, si bien pueden tener connotaciones específicas dentro del
paradigma operante.

Respuesta instrumental u operante


Este término designa cualquier conducta que conlleva una consecuencia
determinada y es susceptible de cambiar en función de ésta. Su nombre
indica que sirve para obtener algo (instrumental) y que actúa sobre el medio
(operante) en lugar de ser provocada por éste, como sucede en el caso del
condicionamiento clásico o respondiente.

En la teoría conductista la palabra “respuesta” es básicamente equivalente a


“conducta” y “acción”, si bien “respuesta” parece hacer referencia en mayor
medida a la presencia de estímulos antecedentes.

Consecuencia
En la psicología conductista y cognitivo-conductual una consecuencia es el
resultado de una respuesta. La consecuencia puede ser positiva (refuerzo) o
negativa (castigo) para el sujeto que lleve a cabo la conducta; en el primer
caso la probabilidad de que se dé la respuesta aumentará y en el segundo
disminuirá.

Es importante tener en cuenta que las consecuencias afectan a la respuesta y,


por tanto, en el condicionamiento operante lo que es reforzado o castigado es
dicha conducta, no la persona o el animal que la lleva a cabo. En todo
momento se trabaja con la intención de influir en el modo en el que se
relacionan los estímulos y las respuestas, ya que desde la filosofía
conductista se evita partir desde una visión esencialista de las personas,
poniendo más énfasis en aquello que puede cambiar que en lo que siempre
parece permanecer igual.

Reforzamiento
Este término designa las consecuencias de las conductas cuando hacen más
probable que se vuelvan a dar. El reforzamiento puede ser positivo, en cuyo
caso estaremos hablando de la obtención de una recompensa o premio por la
ejecución de una respuesta, o negativo, que engloba la desaparición de
estímulos aversivos.

Dentro del reforzamiento negativo podemos distinguir entre respuestas de


evitación y de escape. Las conductas de evitación previenen o impiden la
aparición de un estímulo aversivo; por ejemplo, una persona
con agorafobia que no sale de casa porque así no siente ansiedad está
evitando esta emoción. En cambio las respuestas de escape hacen que el
estímulo desaparezca cuando ya está presente.

La diferencia con la palabra “reforzador” es que ésta se refiere al evento que


se da como consecuencia de la conducta en vez de al procedimiento de
premiar o castigar. Por tanto, “reforzador” es un término más cercano a
“recompensa” y “premio” que a “reforzamiento”.
Castigo
Un castigo es cualquier consecuencia de una conducta determinada que
disminuya la probabilidad de que ésta se repita.

Como el reforzamiento, el castigo puede ser positivo o negativo. El castigo


positivo se corresponde con la presentación de un estímulo aversivo después
de que se produzca la respuesta, mientras que el castigo negativo es la retirada
de un estímulo apetitivo como consecuencia de la conducta.

El castigo positivo se puede relacionar con el uso que se da en general a la


palabra “castigo”, mientras que el castigo negativo se refiere más bien a algún
tipo de sanción o multa. Si un niño no deja de gritar y recibe una bofetada de
su madre para que se calle se le estará aplicando un castigo positivo, mientras
que si en vez de eso le quita la consola a la que está jugando recibirá un
castigo negativo.

 Artículo relacionado: “8 razones para no usar el castigo físico hacia los


hijos”

Estímulo discriminativo y estímulo delta


En Psicología, la palabra “estímulo” se utiliza para designar eventos que
provocan una respuesta por parte de una persona o animal. Dentro del
paradigma operante, el estímulo discriminativo es aquel cuya presencia indica
al sujeto de aprendizaje que si lleva a cabo una determinada conducta ésta
tendrá como consecuencia la aparición de un reforzador o de un castigo.

Por contra, la expresión “estímulo delta” se refiere a aquellas señales que, al


estar presentes, informan de que la ejecución de la respuesta no conllevará
consecuencias.
¿En qué consiste el condicionamiento
operante?
El condicionamiento instrumental u operante es un procedimiento de
aprendizaje que se basa en que la probabilidad de que se dé una respuesta
determinada depende de las consecuenciasesperadas. En el
condicionamiento operante la conducta es controlada por estímulos
discriminativos presentes en la situación de aprendizaje que transmiten
información sobre las consecuencias probables de la respuesta.

Por ejemplo, un cartel de “Abierto” en una puerta nos indica que si intentamos
girar el pomo lo más probable es que se abra. En este caso el cartel sería el
estímulo discriminativo y la apertura de la puerta funcionaría como reforzador
positivo de la respuesta instrumental de girar el pomo.

El análisis conductual aplicado de B. F. Skinner


Skinner desarrolló técnicas de condicionamiento operante que se engloban
en lo que conocemos como “análisis de conducta aplicado”. Éste se ha
mostrado particularmente eficaz en la educación de niños, con un énfasis
especial en los niños con dificultades del desarrollo.

El esquema básico del análisis conductual aplicado es el siguiente. En primer


lugar se plantea una meta conductual, que consistirá en el aumento o la
reducción de comportamientos determinados. En función de esto se reforzarán
las conductas que se quiere desarrollar y se reducirán los incentivos existentes
para la realización de las conductas que se pretende inhibir.

En general la retirada de reforzadores es más deseable que el


castigo positivo puesto que genera menos rechazo y hostilidad por parte del
sujeto. No obstante el castigo puede ser útil en casos en que la conducta
problema es muy disruptiva y requiere una reducción rápida, por ejemplo si se
da violencia.
Durante todo el proceso es fundamental monitorear el progreso de forma
sistemática para poder comprobar con objetividad si los objetivos deseados se
están produciendo. Esto se lleva a cabo principalmente mediante el registro de
datos.

Técnicas operantes para desarrollar conductas


Dadas la importancia y la eficacia del refuerzo positivo, las técnicas operantes
para aumentar conductas tienen una utilidad demostrada. A continuación
describiremos los más relevantes de entre estos procedimientos.

1. Técnicas de instigación
Se consideran técnicas de instigación aquellas que dependen de la
manipulación de estímulos discriminativos para aumentar la probabilidad
de que se dé una conducta.

Este término incluye las instrucciones que incrementan determinadas


conductas, la guía física, que consiste en mover o colocar partes del cuerpo de
la persona entrenada, y el modelado, en que se observa a un modelo
realizando una conducta para poder imitarlo y aprender cuáles son sus
consecuencias. Estos tres procedimientos tienen en común que se centran
en enseñar directamente al sujeto cómo tiene que realizar una
acción determinada, sea verbal o físicamente.

2. Moldeamiento
Consiste en acercar gradualmente una conducta determinada a la conducta
objetivo, empezando por una respuesta relativamente parecida que el sujeto
pueda realizar y modificándola poco a poco. Se lleva a cabo por pasos
(aproximaciones sucesivas) a los que se aplica reforzamiento.
El moldeamiento es considerado especialmente útil para establecer conductas
en sujetos que no se pueden comunicar verbalmente, como las personas con
discapacidad intelectual profunda o los animales.

3. Desvanecimiento
El desvanecimiento se refiere a la retirada gradual de las ayudas o
instigadores que se habían utilizado para reforzar una conducta meta. Se
pretende que el sujeto consolide una respuesta y posteriormente pueda llevarla
a cabo sin necesidad de ayudas externas.

Es uno de los conceptos clave del condicionamiento operante, ya que


permite que los progresos llevados a cabo en terapia o en el entrenamiento
puedan generalizarse a muchos otros ámbitos de la vida.

Este procedimiento consiste fundamentalmente en sustituir un estímulo


discriminativo por otro distinto.

4. Encadenamiento
Una cadena conductual, es decir, una conducta compuesta por varias
conductas simples, se separa en distintos pasos (eslabones). A continuación el
sujeto debe aprender a ejecutar los eslabones uno a uno hasta lograr llevar a
cabo la cadena completa.

El encadenamiento puede realizarse hacia delante o hacia atrás y tiene como


peculiaridad que cada eslabón refuerza al anterior y funciona como
estímulo discriminativo del siguiente.

En ciertos aspectos, buena parte de las habilidades que se consideran talentos


por mostrar un alto grado de destreza y especialización en ellos (como por
ejemplo tocar muy bien un instrumento musical, bailar muy bien, etc.) pueden
ser consideradas fruto de alguna forma de encadenamiento, dado que desde las
habilidades básicas se va progresando hasta alcanzar otras mucho más
trabajadas.

5. Programas de reforzamiento
En un procedimiento de aprendizaje operante, los programas de reforzamiento
son las pautas que establecen cuándo será premiada la conducta y cuándo
no.

Hay dos tipos básicos de programas de reforzamiento: los de razón y los de


intervalo. En los programas de razón se obtiene el reforzador después de que
se dé un número concreto de respuestas, mientras que en los de intervalo esto
sucede después de que haya pasado un tiempo determinado desde la última
conducta reforzada y ésta vuelva a darse.

Ambos tipos de programa pueden ser fijos o variables, lo cual indica que el
número de respuestas o el intervalo de tiempo necesarios para la obtención del
reforzador pueden ser constantes u oscilar en torno a un valor promedio.
También pueden ser continuos o intermitentes; esto significa que la
recompensa puede darse cada vez que el sujeto lleve a cabo la conducta
objetivo o bien de vez en cuando (aunque siempre como consecuencia de una
emisión de la respuesta deseada).

El reforzamiento continuo es más útil para establecer conductas y el


intermitente para mantenerlas. Así, teóricamente un perro aprenderá más
rápido a dar la pata si le damos un premio cada vez que nos ofrezca la pata,
pero una vez aprendida la conducta será más difícil que deje de hacerla si le
damos el reforzador uno de cada tres o cinco intentos.

Técnicas operantes para reducir o eliminar


conductas
Al aplicar técnicas operantes para reducir conductas conviene tener en mente
que, dado que estos procedimientos pueden ser desagradables para los sujetos,
siempre es preferible utilizar los menos aversivos cuando sea posible.
Asimismo estas técnicas son preferibles a los castigos positivos.

A continuación presentamos un listado de estas técnicas en orden de menor a


mayor potencial de generar aversión.

1. Extinción
Se deja de recompensar una conducta que había sido reforzada con
anterioridad. Esto disminuye la probabilidad de que la respuesta vuelva a
darse. Formalmente la extinción es lo opuesto al reforzamiento positivo.

A largo plazo la extinción es más eficaz para eliminar respuestas que el


castigo y el resto de técnicas operantes para reducir conductas, si bien puede
ser más lenta.

Un ejemplo básico de extinción es lograr que un niño pare de patalear


simplemente ignorándolo hasta que se dé cuenta de que su conducta no tiene
las consecuencias deseadas (por ejemplo el enfado de los padres, que
funcionaría como reforzador) y se harte.

2. Entrenamiento de omisión
En este procedimiento, a la conducta del sujeto le sigue la ausencia de la
recompensa; es decir, si se da la respuesta no se obtendrá el reforzador. Un
ejemplo del entrenamiento de omisión podría ser que unos padres impidan a
su hija ver la televisión esa noche por haberles hablado de forma irrespetuosa.
Otro ejemplo sería el hecho de no ir a comprar los juguetes que los niños
piden, si estos se portan mal.
En ámbitos educativos, además, sirve para favorecer que se valoren más los
esfuerzos que otras personas hacen para contentar a los pequeños y que
estos, al haberse acostumbrado a estos tratos, no valoran.

3. Programas de reforzamiento diferencial


Son un subtipo especial de programa de reforzamiento que se utiliza
para reducir (no eliminar) las conductas objetivo aumentando
otras respuestas alternativas. Por ejemplo, se podría premiar a un niño por
leer y por hacer ejercicio y no por jugar a la consola si se pretende que esta
última conducta pierda valor reforzante.

En el reforzamiento diferencial de tasas bajas se refuerza la respuesta si se da


un determinado periodo de tiempo después de la última vez que se produjo.
En el reforzamiento diferencial de omisión el refuerzo se obtiene si, después
de un periodo de tiempo determinado, la respuesta no se ha producido. El
reforzamiento diferencial de conductas incompatibles consiste en reforzar
respuestas incompatibles con la conducta problema; este último
procedimiento se aplica a los tics y la onicofagia, entre otros trastornos.

4. Coste de respuesta
Variante del castigo negativo en que la ejecución de la conducta problema
provoca la pérdida de un reforzador. El carnet de puntos para conductores
que se introdujo en España hace unos años es un buen ejemplo de programa
de coste de respuesta.

5. Tiempo fuera
El tiempo fuera consiste en aislar al sujeto, en general niños, en un entorno no
estimulante en caso de que se produzca la conducta problemática. También
una variante del castigo negativo, se diferencia del coste de respuesta en
que lo que se pierde es la posibilidad de acceder al refuerzo, no el
reforzador en sí.

6. Saciación
El refuerzo que se obtiene por llevar a cabo la conducta es tan intenso o
cuantioso que pierde el valor que tenía para un sujeto. Esto puede tener lugar
por saciación de respuesta o práctica masiva (repetir la conducta hasta que
deje de ser apetitiva) o bien por saciación de estímulo (el reforzador pierde su
apetitividad por exceso).

7. Sobrecorrección
La sobrecorrección consiste en aplicar un castigo positivo relacionado con la
conducta problema. Por ejemplo, es muy utilizada en casos de enuresis, en
que se pide al niño que lave las sábanas después de orinarse encima durante la
noche.

Técnicas de organización de contingencias


Los sistemas de organización de contingencias son procedimientos complejos
a través de los cuales se puede reforzar unas conductas y castigar otras.

La economía de fichas es un ejemplo muy conocido de este tipo de técnicas.


Consiste en entregar fichas (u otros reforzadores genéricos equivalentes)
como premio por la realización de las conductas objetivo; posteriormente los
sujetos pueden intercambiar sus fichas por premios de valor variable. Se
utiliza en escuelas, cárceles y hospitales psiquiátricos.

Los contratos conductuales o de contingencias son acuerdos entre varias


personas, normalmente dos, mediante los que se comprometen a realizar (o a
no realizar) determinadas conductas. En los contratos se detallan las
consecuencias en caso de que se cumplan o incumplan las condiciones
acordadas.

Referencias bibliográficas:

 Domjam, M. (2010). Principios básicos de aprendizaje y conducta. Madrid:


Thomson.

 Labrador, F. J. (2008). Técnicas de modificación de conducta. Madrid:


Pirámide.
Condicionamiento Operante
¿Recompensar o Castigar?

Desarrollado por B.F Skinner, el condicionamiento operante es una


forma de aprender por medio de recompensas y castigos. Este tipo
de condicionamiento sostiene que una determinada conducta y una
consecuencia, ya sea un premio o castigo, tienen una conexión que
nos lleva al aprendizaje.

Los estudios sobre el condicionamiento clásico dieron lugar a la aparición de otras teorías
que pueden explicar el comportamiento y el aprendizaje, y una de ellas es el
condicionamiento operante. El condicionamiento operante trata de negar la creencia de
que los pensamientos y motivaciones internas son los responsables del aprendizaje de un
comportamiento. Como conductista, Skinner creía que sólo las causas externas de
comportamiento debían ser consideradas.

El término "operante" fue utilizado por Skinner con el fin de darnos una buena visión
general de su teoría. Con este término, él quería decir que este tipo de condicionamiento
implica sólo los factores externos que afectan al comportamiento y sus consecuencias.

A. Refuerzo
El refuerzo es un proceso de incrementación de la frecuencia o tasa de ocurrencia de una
determinada conducta, por medio de un estímulo presentado poco después de su
manifestación. Al evento que intensifica la probabilidad de que el comportamiento se
repita se le denomina reforzador. Existen dos tipos de refuerzo:

1. Reforzadores positivos son estímulos favorables que se dan después de la


presentación de la conducta. El refuerzo positivo fortifica la probabilidad de un
comportamiento por medio de la adición de algo.
Ejemplo: Estudiaste mucho y obtuviste una A en el examen de matemáticas. Tu mamá
te recompensa invitándote a tu restaurante favorito. Después de esto, estudias duro
una vez más y también obtienes una A en tu examen de Historia. Tu mamá te
recompensa yendo contigo a ver una película que te gusta. Para tus próximos
exámenes, estudias duro nuevamente.

2. Reforzadores negativos, por otra parte, son la eliminación de los estímulos


desfavorables después de la presentación de un comportamiento. En el
refuerzo negativo, el comportamiento o respuesta se intensifica por la
eliminación de algo.
Ejemplo: Sales de casa a las 8 de la mañana para conducir al trabajo, y siempre
encuentras mucho tráfico. Al día siguiente, sales más temprano de tu casa para poder
evitarlo. Continúas saliendo de tu casa antes de las 08 a.m. durante los próximos días y
sigues evitando el tráfico. Esto significa que el comportamiento de salir de tu casa más
temprano se intensifica por la consecuencia de poder evitar este tráfico.

Tanto con los refuerzos positivos como con los negativos, el comportamiento es
incrementado.

B. Castigo
En contraste con el refuerzo, el castigo es un proceso en el que un estímulo es dado
después de la presentación de un comportamiento causando la disminución de la
probabilidad de que éste ocurra nuevamente. Hay dos tipos de castigos:

1. Castigo positivo es la adición de algo que causa la disminución de la repetición


de determinada conducta. El castigo negativo, también conocido como castigo
por eliminación, se produce cuando un evento o resultado favorable se retira
después de que un comportamiento se produce.

Ejemplo: Un niño molestó a su hermana haciéndola gritar muy alto. Debido a esto, la
madre le dio una nalgada. El niño nunca molestó otra vez a su hermana.

2. Castigo negativo, por otro lado, es la eliminación de algo que es favorable, con
el fin de disminuir la probabilidad de que vuelva a ocurrir ese comportamiento.

Ejemplo: Un adolescente es sorprendido haciendo trampa en un examen. Entonces sus


padres le prohiben utilizar su auto y también le reducen su mesada. En consecuencia,
el adolescente no vuelve a hacer trampa en sus exámenes.

Para tener una mejor comprensión de estos conceptos, aquí hay una tabla que resume
las características del refuerzo positivo / negativo y el castigo positivo / negativo:

Disminuye la probabilidad Aumenta la probabilidad


de comportamiento de comportamiento

Adición Castigo positivo Refuerzo positivo

Eliminación Castigo negativo Refuerzo negativo

También podría gustarte