Condicionamiento Operante o Instrumental: Principios, Técnicas y Aplicaciones

Condicionamiento Operante o Instrumental

Representantes: Thorndike, Skinner

▪ La sistematización y racionalización de los procedimientos de reforzamiento.
▪ Las consecuencias de la propia conducta contribuyen a que aprendamos a regular nuestro propio proceder. Se tiende a evitar las consecuencias desagradables y adversas y a buscar las positivas o agradables.
Concepto fundamental → las consecuencias inmediatas de cualquier conducta que realiza una persona, aumentan, disminuyen o mantienen constante la probabilidad de que dicha persona, vuelva a realizar esa conducta.

Ley del Efecto

Ensayo y error → Thorndike observó que la conducta casual o aleatoria de un animal podía venir acompañada por respuestas del medio ambiente satisfactorias para el animal.
Ley del Efecto: Cuando las acciones de un animal, en cualquier situación, son acompañadas o seguidas (contigüidad) de una experiencia satisfactoria, el animal relaciona tal conducta con la satisfacción obtenida y estará más propenso a ejecutar las mismas acciones si se encuentra en situaciones similares.
▪ Si las acciones del animal llegan a asociarse con una molestia o experiencia desagradable, el animal no repetirá esas acciones.

Ed — R — Er

Ed → Estímulo discriminativo
R → Respuesta
Er → Estímulo Consecuencia o reforzador

Estímulo discriminativo → señala al organismo la oportunidad para ejecutar o también para omitir la respuesta (ej.: semáforo: ayuda en el control de la conducta, pero no la causa).
Tipos operacionales, refuerzo y reforzadores → En función de:
▪ Presencia o ausencia de clave o estímulo discriminativo (señala al organismo si habrá reforzador o no, ej.: luz, sonido).
▪ Ejecución u omisión de una determinada respuesta.
▪ Premio o castigo como estímulo – consecuencia (tipo de reforzador).
▪ La palabra reforzamiento o refuerzo, es el término genérico para referirse al procedimiento general de la utilización de premios o castigos con el fin de afianzar determinados comportamientos.

Formas de Clasificar los Reforzadores

Primarios → con valor natural o innato reforzante (ej.: comida, agua, sexo).
Secundarios → con valor reforzante adquirido por su asociación previa con reforzadores primarios (ej.: dinero).
Tangibles o concretos → ej.: comida, juguete, ropa, caramelos.
Simbólicos o tokens → ej.: diploma, medalla.
No sociales → ej.: comida. Sociales → ej.: besos, abrazos, caricias, aplausos.
Generalizados → aquellos que siempre funcionan como reforzadores, sin depender de un estado de privación o necesidad.
No generalizados → que operan como reforzadores en tanto el organismo experimenta estado de deprivación (ej.: hambre, sed).

Reforzador

▪ Todo estímulo, hecho o situación, que fortalece el aprendizaje o intensifica la tendencia a comportarse de una manera determinada.
▪ Dos tipos:
REFORZADOR POSITIVO:
▪ Estímulo o consecuencia que acrecienta la probabilidad de que el organismo repita las conductas que lo precedieron (aumento en la tasa de respuesta). Estímulo que, al ser presentado tras una conducta, aumenta la probabilidad de ocurrencia de tal conducta.
▪ Ej. → tokens; reforzadores sociales como: caricias, besos, muestras de aprobación, de afecto, etc.
REFORZADOR NEGATIVO:
▪ Estímulo cuya eliminación acrecienta la probabilidad de que el organismo repita las conductas previas a esa supresión (aumento en la tasa de respuesta). Estímulo que, al ser eliminado, aumenta la probabilidad de ocurrencia de la conducta que provocó la supresión.
▪ Ej. → aquellos estímulos que los organismos evitan o que producen rechazo (estímulos generalmente aversivos) Ej.: tomo aspirina ya que me permite escapar del dolor

Condicionamientos en Interacciones Humanas

▪ Las personas se condicionan entre sí. Las consecuencias de las interacciones con otros definen, de alguna manera, las futuras interacciones.
▪ El castigo a diferencia del refuerzo positivo:
▪ No es constructivo.
▪ No es permanente en sus efectos.
▪ No enseña a las personas a comportarse.
▪ Provoca enojo, frustración, reacciones agresivas.
▪ Los lugares en que se utiliza, desarrollan climas tóxicos, poco saludables.
▪ Las personas que recurren a un excesivo uso del castigo, terminan siendo personas tensas y desagradables.
▪ Produce modelaje de conductas agresivas.
▪ Por el contrario, el refuerzo positivo:
▪ Es constructivo.
▪ Fomenta conductas que perduran y que se generalizan a nuevas situaciones.
▪ Es eficaz.
▪ Hace que las personas se sientan bien, contribuyendo a crear ambientes nutritivos.
▪ “El castigo, no debe constituir el procedimiento, o al menos no el más importante, al momento de querer modificar una conducta”.

Programa de Reforzamiento

Según se utilice como criterio el tiempo o el número de respuestas emitidas, los INTERMITENTES se subdividen en:
▪ Programas de razón (fijo o variable)
▪ Programa de intervalo (fijo o variable)

Programa de Razón Variable:

El reforzador se consigue después de un número que varía aleatoriamente (siempre dentro de un promedio).
Ej. → máquinas de los casinos, juegos de azar.
La incertidumbre hace que los sujetos produzcan la respuesta constantemente

Programa de Intervalo Variable:

El reforzador es dado después de un tiempo que varía aleatoriamente (dentro de un promedio).
Ej. → un profesor que hace controles de lectura sorpresa, cada cierto tiempo.

Programas de Razón:

Producen un aprendizaje más rápido, pero se puede extinguir fácilmente cuando se suspenden los reforzadores.

Programas de Intervalo:

Producen un aprendizaje más estable, más resistente a la extinción.

¿Qué es lo ideal para condicionar, mediante condicionamiento operante?

▪ Combinar el reforzamiento continuo e intermitente.
▪ Al inicio usar reforzamiento continuo para enseñar la respuesta, y luego intermitente, para que sea más difícil de extinguir.

Etapas a Seguir en un Programa de Modificación de Conductas

CONSIDERACIONES GENERALES PARA TODOS LOS PROCEDIMIENTOS:
1. Definir en forma clara y precisa la conducta que se quiere fomentar o la que se quiere eliminar.
2. Determinar los posibles reforzadores de acuerdo a la edad y características del sujeto.
3. Dedicar un periodo de tiempo a una cuidadosa observación de la conducta, para determinar su línea base o nivel operante (0 = no existen en el repertorio de conducta. 1 = se establece antes de la aplicación del programa. 2 = medición posterior)
4. Aplicar el programa (contrato de contingencia)
5. Evaluar comparando el registro inicial con el comportamiento actual, establecer ajustes.

Shaping o Modelamiento de Aproximaciones Sucesivas

▪ Fases:
1. Identificar lo que el sujeto puede hacer, que se relacione con la conducta esperada.
2. Señalar la conducta deseada
3. Identificar los posibles reforzadores en el entorno del sujeto.
4. Separa la conducta terminal en pequeñas etapas.
5. Llevar al sujeto desde la conducta inicial a la terminal reforzando sucesivamente cada aproximación

Modeling o Aprendizajes Mediante Modelos

A través de la observación de experiencias ajenas (aprendizaje vicario).
▪ Muchas conductas no existentes, de nivel operante 0, se aprenden simplemente observando a quienes las poseen y la manera como las ejecutan.

Programas de Refuerzo

▪ Son especificaciones o reglas relativas a la aplicación de los reforzadores: en qué circunstancias y de acuerdo a qué criterios deben otorgarse.
▪ Se dividen en:
Continuos → en los que el reforzador se aplica cada vez que aparecen las conductas.
Intermitente o Parcial → no se refuerza la conducta cada vez que aparece, se hace sólo en determinadas ocasiones. Según se utilice como criterio el tiempo o el número de respuestas emitidas, se subdividen en:
▪ Programas de intervalo o de razón.
▪ Cada uno de ellos a su vez, puede ser fijo o variable.

La Saciedad

▪ Se basa en la utilización del propio reforzador, pero otorgado en exceso.
▪ El sujeto recibe tantos reforzadores, que llega a perder su motivación por obtenerlos.

Castigo

▪ No debe ser humillante, ni fruto del descontrol de quien castiga.
▪ El “costo de respuesta”, consiste en privar al sujeto de algún reforzador que tiene a mano y que es posible retirar.