Programas de Reforzamiento en Psicología: Condicionamiento Clásico e Instrumental

T.9.1 PROGRAMAS DE REFORZAMIENTO SIMPLE

Reforzamiento Continuo

Se refuerza cada respuesta (ej., siempre que nos pinchan, sentimos dolor).

Reforzamiento Parcial

No todas las respuestas son reforzadas (ej., no siempre que salimos de fiesta nos divertimos).

1. Programas de Razón

– Razón Fija: Reforzamiento después de un número fijo de respuestas (ej., cobrar un sueldo mínimo tras X ventas).

– Razón Variable: Reforzamiento después de un número variable de respuestas (ej., máquinas tragamonedas).

2. Programas de Intervalo

– Intervalo Fijo: Reforzamiento después de un tiempo fijo (ej., hornear una pizza por 10 minutos).

– Intervalo Variable: Reforzamiento después de un tiempo variable (ej., esperar una beca).

3. Repercusiones Conductuales

– Razón Fija: Control sobre el proceso, se decide cuándo responder.

– Razón Variable: Mayor repetición de la conducta por falta de control sobre consecuencias.

– Intervalo Fijo: Control relativo sobre el tiempo, la conducta aumenta cerca del refuerzo.

– Intervalo Variable: Pausas aleatorias, conducta sostenida.

4. Programas de Reforzamiento de Tasas de Respuesta

– Basados en la velocidad de respuesta (ej., 12 respuestas/minuto para velocidad alta).

T.9.2 RELACIÓN ENTRE RESPUESTA Y REFORZADOR

1. Contigüidad

– Importancia del tiempo entre conducta y consecuencia (óptimo: 0-5 segundos).

– Uso de reforzadores secundarios y marcaje de conducta para mejorar la contigüidad.

2. Contingencia

– Importancia de la relación entre conducta y consecuencia para evitar reforzamiento accidental (supersticiones).

Indefensión Aprendida: Experiencia de falta de control que lleva a déficits motivacionales, cognitivos y emocionales (ej., experimentar siempre fracasos).

T.9.3 PROGRAMAS CONCURRENTES DE REFORZAMIENTO

– Permiten estudiar la elección de conductas.

– Procedimiento: Caja con dos botones (A y B) con diferentes programas de reforzamiento.

1. Medidas de Conductas de Elección

– Tasa Relativa de Respuesta: Comparación de respuestas entre A y B.

– Tasa de Reforzamiento: Cantidad de refuerzos obtenidos por cada botón.

2. Ley de Igualación

– Igualación de la tasa de respuesta con la tasa de reforzamiento.

– Supraigualación: Alta sensibilidad al reforzador.

– Infraigualación: Baja sensibilidad al reforzador.

3. Teorías Explicativas

– Maximización Molecular: Elección de alternativas con mayores probabilidades de refuerzo inmediato.

– Maximización Molar: Cálculo a largo plazo para maximizar beneficios.

– Mejoramiento: Decisiones a medio plazo para mejorar la situación actual.

T.9.4 ELECCIÓN CON COMPROMISO

– En la vida real, no siempre hay dos opciones disponibles simultáneamente (programas concurrentes encadenados).

1. ¿Qué se Elige?

– En situaciones difíciles, se prefieren programas fijos (previsibles).

– En estabilidad, se prefieren programas variables (divertidos).

2. Condicionamiento Clásico de Segundo Orden

– Señales visuales (claves) indican opciones disponibles tras una elección, asociando estímulos con refuerzos posteriores (ej., el color verde asociado al amarillo y luego a la comida).

  1. Naturalmente, los cangrejos machos saben que las hembras están preparadas para la reproducción si éstas tienen el caparazón con una dureza de 10 unidades, que es la dureza natural de los cangrejos. Si le presentamos a un cangrejo macho un caparazón con una dureza de 20 unidades y su respuesta sexual es máxima, ¿qué tipo de estímulo es ese caparazón de dureza de 20 unidades?
    • A. Estímulo supranormal
    • B. Estímulo a lo que se ha sensibilizado
    • C. Estímulo a lo habituado
    • D. Estímulo incondicional
  2. Albertito ve un enchufe y pone los dedos dentro. Recibe una corriente y saca los dedos del enchufe llorando. En este caso, ¿cuál sería el estímulo condicionado?
  • A. Meter los dedos dentro
  • B. El enchufe
  • C. Retirar la mano
  • D. La corriente
¿Cuál es el peor procedimiento para controlar si se está consiguiendo un condicionamiento clásico excitatorio?
  • A. Realizar un grupo control aleatorio
  • B. Realizar un ensayo de prueba
  • C. Hacer un grupo control desparejado explícito
  • D. Hacer un grupo control sin estímulo incondicionado
En un procedimiento típico de acondicionamiento clásico inhibidor, el segundo estímulo condicional que se presenta terminará siendo:
  • A. El estímulo condicional excitador.
  • B. El estímulo condicional inhibidor.
  • C. El estímulo habituador.
  • D. El estímulo condicional que utilizamos para asegurarnos de que el acondicionamiento inhibitorio se ha producido correctamente.
Elige la respuesta correcta sobre los modelos teóricos del acondicionamiento clásico
  • A. Los modelos de estímulo-respuesta plantean que el acondicionamiento clásico se produce por una relación directa entre la capacidad del organismo para procesar el estímulo y la respuesta, mientras que los modelos de estímulo-estímulo plantean que el condicionamiento se explica por una relación directa entre la capacidad del organismo para procesar el estímulo y un estímulo interno cognitivo.
Cuando presentamos comida a un perro se pueden producir dos respuestas incondicionales características, como oler y comer. ¿Cómo explicar ese hecho?
  • A. Porque son dos conductas del mismo sistema de conducta.
  • B. Porque se produce un bloqueo entre dos estímulos condicionales.
  • C. Porque son dos conductas de distintos sistemas de conducta.
  • D. Porque son dos conductas del mismo sistema condicional.
¿Qué mecanismo o efecto se caracteriza porque el aprendizaje previo realizado entre un EC1 y un EI dificulta el aprendizaje que se realiza con un EC2?
  • A. La inhibición latente.
  • B. La devaluación del EI.
  • C. El efecto de bloqueo.
  • D. El pre-acondicionamiento sensorial.
¿Qué procedimiento de acondicionamiento clásico excitador tiene la característica de iniciar y finalizar la presentación del EI al tiempo que la EC?
  • A. Demorado
  • B. De huella.
  • C. Simultáneo
  • D. Hacia atrás.
En el paradigma de acondicionamiento clásico, ¿cuál es el estímulo que en principio no elicita ninguna respuesta pero que a lo largo del procedimiento se asocia a un miedo aprendido?
  • A. La respuesta incondicional
  • B. La respuesta condicional
  • C. El estímulo condicional
  • D. El estímulo incondicional
¿Qué debemos hacer para que un acondicionamiento de orden superior no se transforme en un acondicionamiento inhibitorio?
  • A. No presentar nunca el EI real
  • B. Presentar siempre el EI real
  • C. Presentar un EI con efectos contrarios al EI real
  • D. Presentar el EI real de vez en cuando
Según la ley del efecto de Thorndike,
  • A. Obtener una consecuencia negativa después de realizar una conducta potenciará la relación entre el estímulo y la respuesta.
  • B. Obtener una consecuencia positiva después de realizar una conducta suprimirá la relación entre el estímulo y la respuesta.
  • C. Obtener una consecuencia positiva después de realizar una conducta potenciará la relación entre el estímulo y la respuesta.
  • D. Obtener una consecuencia positiva después de realizar una conducta potenciará la relación entre el estímulo y la consecuencia.
De la fenomenología de la extinción, ¿qué se caracteriza por la recuperación de la respuesta condicional debido a la presentación de un estímulo incondicional igual o similar al generado por el aprendizaje original?
  • A. El restablecimiento del acondicionamiento
  • B. La recuperación espontánea
  • C. La recuperación de la extinción
  • D. La renovación del acondicionamiento
Cada vez que un perro hace sus necesidades fuera de casa nosotros le damos un caramelo. ¿Qué tipo de programa de reforzamiento estamos empleando?
  • A. Razón fija
  • B. Razón variable
  • C. Intervalo variable
  • D. Reforzamiento de tasas de respuesta rápida
¿Cuál de las teorías para explicar la ley de igualación propone que se distribuyan las respuestas entre ambas opciones para maximizar la cantidad de reforzadores a la larga?
  • A. Teoría de la contigüidad temporal
  • B. Teoría de la maximización molar
  • C. Teoría de la maximización molecular
  • D. Teoría de mejora
En los programas concurrentes encadenados, ¿qué opción era la que elegían las palomas más a menudo una vez realizado el aprendizaje?
  • A. La que implicaba una mayor estereotipia conductual
  • B. La que implicaba una predicción más fácil de cuándo llegaría el reforzador
  • C. Elegían el programa de razón variable
  • D. La que implicaba una mayor variabilidad conductual
En ocasiones no podemos aplicar la consecuencia con la contigüidad deseada. ¿Cómo se dice el procedimiento que debemos utilizar en estas ocasiones y que se caracteriza por mostrar un estímulo neutro al sujeto cuando hace la conducta de tal forma que después pueda hacer la asociación correcta entre cuál era la conducta y cuál la consecuencia?
  • A. Marcar la conducta
  • B. Dar un refuerzo secundario
  • C. Dar un refuerzo primario
  • D. Marcar el reforzador
¿Cómo se llaman las conductas normales que realizan los animales cuando obtienen un refuerzo en un ambiente natural y que pueden dificultar el aprendizaje asociativo?
  • A. Deriva instintiva
  • B. Contraste negativo
  • C. Sistema de conducta
  • D. Integral distintiva
Según la teoría moderna de ambos procesos, cuando se produce un CI, el efecto fundamental del acondicionamiento instrumental se produce entre…
  • A. Entre la respuesta y la consecuencia
  • B. Entre el estímulo y el resultado del aprendizaje
  • C. Entre el estímulo y la respuesta
  • D. Entre el estímulo y la consecuencia
¿Cuál fue una de las repercusiones del descubrimiento del principio de Premack?
  • A. Que en un CC, las consecuencias podían ser conductas además de estímulos.
  • B. Que en un CI, las consecuencias podían ser conductas/actividades además de estímulos.
  • C. Que en un CI, las consecuencias sólo podían ser conductas/actividades.
  • D. Que en un CI, las consecuencias sólo podían ser estímulos.
Según la función descontadora del valor, ¿cómo incrementar el valor subjetivo de un reforzador?
  • A. Demorando mucho su presentación
  • B. Disminuyendo la magnitud objetiva de la recompensa
  • C. Aumentando la magnitud subjetiva de la recompensa
  • D. Demorando poco su presentación
La prueba de medición de la inhibición condicionada en la que se mida la forma en la que la presentación del EC- interrumpe o suprime la respuesta que normalmente sería provocada por un EC+, se denomina:
  • A. Prueba del retraso de la adquisición
  • B. Prueba de dificultad de emparejamiento
  • C. Prueba del estímulo compuesto (o de sumación)
  • D. No hay forma de medir la inhibición condicionada

La prueba del retraso de la adquisición es un procedimiento que identifica a un estímulo como inhibidor acondicionado si es más lento para adquirir propiedades excitatorias que un estímulo de comparación. Verdadero

La prueba de retraso de la adquisición es un procedimiento de prueba que identifica un estímulo como inhibidor acondicionado si éste reduce la respuesta provocada por un estímulo acondicionado excitatorio. Falso

47. ¿Qué procedimiento implica que un segundo estímulo condicional no tiene la misma capacidad de aprendizaje porque se presenta con otro estímulo condicional de mayor saliencia?

  • A. Sombra
  • B. Inhibición latente
  • C. Pre-exposición de la EC
  • D. Bloqueo

29. Una paloma pica un botón, 3 segundos después pica en el botón y recibe un pelet de comida, 6 segundos después pica en el botón y no obtiene nada, 2 segundos después pica el botón y recibe un pelet de comida, etc. ¿Qué procedimiento estamos utilizando?

  • A. Reforzamiento de tasas de respuesta lenta
  • B. Reforzamiento de tasas de respuesta rápida
  • C. Intervalo fijo
  • D. Razón variable

7. ¿Cómo se llama el procedimiento en el que se presenta un EC2 que funciona como un inhibidor natural tanto del EI como del EC1?

  • A. Precondicionamiento sensorial.
  • B. Acondicionamiento clásico excitador.
  • C. Acondicionamiento clásico inhibitorio de contingencia negativa.
  • D. Acondicionamiento clásico inhibitorio estándar.

8. ¿Cuál es el procedimiento más eficaz para generar un aprendizaje asociativo por condicionamiento clásico?

  • A. El simultáneo.
  • B. El demorado.
  • C. El demorado, debido a que se produce un intervalo de huella.
  • D. El de huella, debido a que se produce un intervalo de huella.

15. El estímulo que al inicio no provoca una respuesta particular, pero llega a hacerlo como resultado de su asociación con un estímulo incondicionado, una vez se ha producido esta asociación se llama inicialmente…

  • A. Incondicionado
  • B. Condicionado
  • C. Adquirido
  • D. Neutro

26. ¿Qué tipo de respuesta es la que podríamos predecir que se produce habitualmente después de aplicar cualquier procedimiento de CI?

  • A. Variabilidad de respuesta
  • B. Potenciación de conducta
  • C. Reducción de conducta
  • D. Respuesta estereotipada

34. ¿Cómo se define la tasa relativa de reforzamiento?

  • A. Cantidad de refuerzo que se da en una opción respecto al total.
  • B. Cantidad de refuerzo que se da en una opción respecto a la cantidad de refuerzo que se da en la otra opción.
  • C. Cantidad de conducta que se hace en una opción respecto al total.
  • D. Calidad de refuerzo que se da en una opción respecto al total.

31. En la fase 1 (aprendizaje) del procedimiento de indefensión aprendida…

  • A. Un grupo puede escapar de la corriente apretando un botón, otro grupo no puede escapar botón aunque apriete el botón y un grupo control puede escapar algunas vueltas aprendiendo el botón.
  • B. Un grupo puede escapar de la corriente apretando un botón y otro grupo no puede escapar aunque apriete el botón.
  • C. Un grupo no puede escapar aunque apriete el botón y un grupo control no recibe ningún tipo de corriente.
  • D. Un grupo puede escapar de la corriente apretando un botón, otro grupo no puede escapar aunque apriete el botón y un grupo control no recibe ningún tipo de corriente.

32. ¿Cuál es la conclusión básica que se extrae del experimento que Skinner hizo sobre reforzamiento accidental y que dio lugar a la superstición de la paloma?

  • A. La contigüidad temporal es el factor fundamental para el aprendizaje.
  • B. Debido a efectos de contingencia, cada paloma asociaba el refuerzo a una conducta diferente.
  • C. Las palomas repetían las conductas debido a la contigüidad temporal entre su conducta y el refuerzo.
  • D. Cada paloma repetía una conducta diferente debido a que cada uno recibía el refuerzo con una contigüidad temporal diferente.

36. A Sara le gustan mucho los juegos de mesa. En casa hay una norma, y es que cuando se empieza a jugar a un juego de mesa, debe acabar. No se puede dejar a medias ni se cambia de juego. Su padre le propone elegir entre Marco Polo, juego de gestión de recursos donde estarán cerca de 120 minutos jugando y que recibe premios durante la partida cuando se van alcanzando objetivos, y Kitchen Rush, juego cooperativo en el que cada ronda se juega a 4 minutos y se consiguen puntos al final de cada una. Desde el punto de vista del aprendizaje asociativo, ¿qué tipo de tarea se está explicando en este caso?

  • A. Programa concurrente encadenado
  • B. Dos procedimientos básicos de acondicionamiento instrumental, ambos de reforzamiento positivo.
  • C. Programa concurrente
  • D. Dos programas de reforzamiento simple, uno de razón y otro de intervalo.

37. Carmen tiene dos gatos, Cugui e Ironman. Carmen juega muy a menudo con Cuqui, porque muy a menudo la gata entra en el juego y eso le hace sentir muy bien a Carmen. Con Ironman, su gato, juega menos porque cuando Carmen empieza a interactuar con él, el gato pasa de ella. Carmen siempre tiene libertad para intentar jugar con uno u otro sin ningún tipo de restricción. ¿Qué está operando en este caso?

  • A. Ley de infraigualación, porque juega menos con el Ironman que con la Cuqui.
  • B. Ley de supraigualación, porque juega más con la Cuqui que con el Ironman.
  • C. Programa de reforzamiento de razón, porque Carmen recibe la atención de los gatos cuando hace la conducta de jugar con ellos.
  • D. Ley de igualación, porque juega más con la gata que le hace más caso.

41. En el experimento de Eisenberg y Adornetto (1986) sobre el aprendizaje de autocontrol de los niños, ¿en qué condición mostraban a los niños que habían mejorado en su autocontrol?

  • A. En los que al pre-test querían un gran refuerzo demorado y fueron entrenados dándoles un pequeño refuerzo inmediato con manchas difíciles.
  • B. En los que al pre-test querían un pequeño refuerzo inmediato y fueron entrenados dándoles un gran refuerzo demorado con manchas difíciles.
  • C. En los que al pre-test querían un pequeño refuerzo inmediato y fueron entrenados dándoles un gran refuerzo demorado con manchas fáciles.
  • D. En los que al pre-test querían un gran refuerzo demorado y fueron entrenados dándoles un gran refuerzo demorado con manchas fáciles.

42. Según la evidencia empírica de que disponemos actualmente, elige el procedimiento que NO se ha demostrado que sirva para mejorar el autocontrol desde el acondicionamiento instrumental.

  • A. Decirte mensajes positivos a ti mismo/a como refuerzo positivo.
  • B. Caminar por la naturaleza mientras tomas la decisión.
  • C. Pensar en actividades específicas que harías dentro de un tiempo con el dinero que ganarías.
  • D. Hacer explícito lo implícito.

44. Nilo tiene un loro que sabe cantar el himno del Real Madrid. Ahora quiere enseñarle a cantarlo cuando vea el escudo del Barça. Para conseguirlo, le enseña el escudo del Barça y, cuando el loro canta el himno del Real Madrid, le da su laminadura favorita. Desde la teoría moderna de los dos procesos, entre qué elementos del procedimiento de acondicionamiento instrumental se está produciendo ¿una asociación de ACONDICIONAMIENTO CLÁSICO?

  • A. Entre cantar el himno del Real Madrid y la golosina favorita.
  • B. Entre cantar el himno del Real Madrid y la intención del Nilo de enseñar al loro.
  • C. Entre el escudo del Barça y la golosina favorita.
  • D. Entre el escudo del Barça y cantar el himno del Real Madrid.

44. Nilo tiene un loro que sabe cantar el himno del Real Madrid. Ahora quiere enseñarle a cantarle cuando vea el escudo del Barça. Para ello, le enseña el escudo del Barça y, cuando el loro canta el himno del Real Madrid, le da su laminadura favorita. Desde la teoría moderna de los dos procesos, ¿entre qué elementos del procedimiento de acondicionamiento instrumental se está produciendo una asociación de ACONDICIONAMIENTO INSTRUMENTAL (LEY DE THORNDIKE)?

  • A. Entre cantar el himno del Real Madrid y las ganas de enseñarle al loro.
  • B. Entre el escudo del Barça y cantar el himno del Real Madrid.
  • C. Entre cantar el himno del Real Madrid y la laminadura favorita.
  • D. Entre el escudo del Barça y la golosina favorita.

45. A María le gusta poco jugar a juegos de mesa, pero leer le gusta mucho. Según el principio de Premack, cómo debería ordenar estas actividades para que María se motive cada vez más a hacer…

  • A. Le haré jugar a juegos de mesa primero y después leer, ya que leer es la conducta más probable.
  • B. Le haré leer primero y después jugar a juegos de mesa para cumplir con la ley de igualación.
  • C. Le haré leer primero y después jugar a juegos de mesa, ya que jugar a juegos de mesa es la conducta más probable.
  • D. Le haré jugar a juegos de mesa primero y después leer, ya que jugar a juegos de mesa es la conducta más probable.

46. Elige la opción correcta sobre los factores que modulan la generalización de los aprendizajes.

  • A. Todos los reforzadores (o castigos) son igual de eficaces para generar aprendizaje.
  • B. Todas las respuestas se pueden asociar a todo tipo de estímulos con igual facilidad.
  • C. Hay reforzadores con los que más se aprende cuando se asocian a un estímulo en concreto, como por ejemplo, reforzador apetitivo con estímulos visuales.
  • D. Se produce la generalización porque todos los estímulos neutros tienen la misma capacidad asociativa, independientemente de su saliencia o de la exposición previa a ellos.