Programas de Reforzamiento en Psicología: Condicionamiento Clásico e Instrumental
T.9.1 PROGRAMAS DE REFORZAMIENTO SIMPLE
Reforzamiento Continuo
Se refuerza cada respuesta (ej., siempre que nos pinchan, sentimos dolor).
Reforzamiento Parcial
No todas las respuestas son reforzadas (ej., no siempre que salimos de fiesta nos divertimos).
1. Programas de Razón
– Razón Fija: Reforzamiento después de un número fijo de respuestas (ej., cobrar un sueldo mínimo tras X ventas).
– Razón Variable: Reforzamiento después de un número variable de respuestas (ej., máquinas tragamonedas).
2. Programas de Intervalo
– Intervalo Fijo: Reforzamiento después de un tiempo fijo (ej., hornear una pizza por 10 minutos).
– Intervalo Variable: Reforzamiento después de un tiempo variable (ej., esperar una beca).
3. Repercusiones Conductuales
– Razón Fija: Control sobre el proceso, se decide cuándo responder.
– Razón Variable: Mayor repetición de la conducta por falta de control sobre consecuencias.
– Intervalo Fijo: Control relativo sobre el tiempo, la conducta aumenta cerca del refuerzo.
– Intervalo Variable: Pausas aleatorias, conducta sostenida.
4. Programas de Reforzamiento de Tasas de Respuesta
– Basados en la velocidad de respuesta (ej., 12 respuestas/minuto para velocidad alta).
T.9.2 RELACIÓN ENTRE RESPUESTA Y REFORZADOR
1. Contigüidad
– Importancia del tiempo entre conducta y consecuencia (óptimo: 0-5 segundos).
– Uso de reforzadores secundarios y marcaje de conducta para mejorar la contigüidad.
2. Contingencia
– Importancia de la relación entre conducta y consecuencia para evitar reforzamiento accidental (supersticiones).
Indefensión Aprendida: Experiencia de falta de control que lleva a déficits motivacionales, cognitivos y emocionales (ej., experimentar siempre fracasos).
T.9.3 PROGRAMAS CONCURRENTES DE REFORZAMIENTO
– Permiten estudiar la elección de conductas.
– Procedimiento: Caja con dos botones (A y B) con diferentes programas de reforzamiento.
1. Medidas de Conductas de Elección
– Tasa Relativa de Respuesta: Comparación de respuestas entre A y B.
– Tasa de Reforzamiento: Cantidad de refuerzos obtenidos por cada botón.
2. Ley de Igualación
– Igualación de la tasa de respuesta con la tasa de reforzamiento.
– Supraigualación: Alta sensibilidad al reforzador.
– Infraigualación: Baja sensibilidad al reforzador.
3. Teorías Explicativas
– Maximización Molecular: Elección de alternativas con mayores probabilidades de refuerzo inmediato.
– Maximización Molar: Cálculo a largo plazo para maximizar beneficios.
– Mejoramiento: Decisiones a medio plazo para mejorar la situación actual.
T.9.4 ELECCIÓN CON COMPROMISO
– En la vida real, no siempre hay dos opciones disponibles simultáneamente (programas concurrentes encadenados).
1. ¿Qué se Elige?
– En situaciones difíciles, se prefieren programas fijos (previsibles).
– En estabilidad, se prefieren programas variables (divertidos).
2. Condicionamiento Clásico de Segundo Orden
– Señales visuales (claves) indican opciones disponibles tras una elección, asociando estímulos con refuerzos posteriores (ej., el color verde asociado al amarillo y luego a la comida).
- Naturalmente, los cangrejos machos saben que las hembras están preparadas para la reproducción si éstas tienen el caparazón con una dureza de 10 unidades, que es la dureza natural de los cangrejos. Si le presentamos a un cangrejo macho un caparazón con una dureza de 20 unidades y su respuesta sexual es máxima, ¿qué tipo de estímulo es ese caparazón de dureza de 20 unidades?
- A. Estímulo supranormal
- B. Estímulo a lo que se ha sensibilizado
- C. Estímulo a lo habituado
- D. Estímulo incondicional
- Albertito ve un enchufe y pone los dedos dentro. Recibe una corriente y saca los dedos del enchufe llorando. En este caso, ¿cuál sería el estímulo condicionado?
- A. Meter los dedos dentro
- B. El enchufe
- C. Retirar la mano
- D. La corriente
- A. Realizar un grupo control aleatorio
- B. Realizar un ensayo de prueba
- C. Hacer un grupo control desparejado explícito
- D. Hacer un grupo control sin estímulo incondicionado
- A. El estímulo condicional excitador.
- B. El estímulo condicional inhibidor.
- C. El estímulo habituador.
- D. El estímulo condicional que utilizamos para asegurarnos de que el acondicionamiento inhibitorio se ha producido correctamente.
- A. Los modelos de estímulo-respuesta plantean que el acondicionamiento clásico se produce por una relación directa entre la capacidad del organismo para procesar el estímulo y la respuesta, mientras que los modelos de estímulo-estímulo plantean que el condicionamiento se explica por una relación directa entre la capacidad del organismo para procesar el estímulo y un estímulo interno cognitivo.
- A. Porque son dos conductas del mismo sistema de conducta.
- B. Porque se produce un bloqueo entre dos estímulos condicionales.
- C. Porque son dos conductas de distintos sistemas de conducta.
- D. Porque son dos conductas del mismo sistema condicional.
- A. La inhibición latente.
- B. La devaluación del EI.
- C. El efecto de bloqueo.
- D. El pre-acondicionamiento sensorial.
- A. Demorado
- B. De huella.
- C. Simultáneo
- D. Hacia atrás.
- A. La respuesta incondicional
- B. La respuesta condicional
- C. El estímulo condicional
- D. El estímulo incondicional
- A. No presentar nunca el EI real
- B. Presentar siempre el EI real
- C. Presentar un EI con efectos contrarios al EI real
- D. Presentar el EI real de vez en cuando
- A. Obtener una consecuencia negativa después de realizar una conducta potenciará la relación entre el estímulo y la respuesta.
- B. Obtener una consecuencia positiva después de realizar una conducta suprimirá la relación entre el estímulo y la respuesta.
- C. Obtener una consecuencia positiva después de realizar una conducta potenciará la relación entre el estímulo y la respuesta.
- D. Obtener una consecuencia positiva después de realizar una conducta potenciará la relación entre el estímulo y la consecuencia.
- A. El restablecimiento del acondicionamiento
- B. La recuperación espontánea
- C. La recuperación de la extinción
- D. La renovación del acondicionamiento
- A. Razón fija
- B. Razón variable
- C. Intervalo variable
- D. Reforzamiento de tasas de respuesta rápida
- A. Teoría de la contigüidad temporal
- B. Teoría de la maximización molar
- C. Teoría de la maximización molecular
- D. Teoría de mejora
- A. La que implicaba una mayor estereotipia conductual
- B. La que implicaba una predicción más fácil de cuándo llegaría el reforzador
- C. Elegían el programa de razón variable
- D. La que implicaba una mayor variabilidad conductual
- A. Marcar la conducta
- B. Dar un refuerzo secundario
- C. Dar un refuerzo primario
- D. Marcar el reforzador
- A. Deriva instintiva
- B. Contraste negativo
- C. Sistema de conducta
- D. Integral distintiva
- A. Entre la respuesta y la consecuencia
- B. Entre el estímulo y el resultado del aprendizaje
- C. Entre el estímulo y la respuesta
- D. Entre el estímulo y la consecuencia
- A. Que en un CC, las consecuencias podían ser conductas además de estímulos.
- B. Que en un CI, las consecuencias podían ser conductas/actividades además de estímulos.
- C. Que en un CI, las consecuencias sólo podían ser conductas/actividades.
- D. Que en un CI, las consecuencias sólo podían ser estímulos.
- A. Demorando mucho su presentación
- B. Disminuyendo la magnitud objetiva de la recompensa
- C. Aumentando la magnitud subjetiva de la recompensa
- D. Demorando poco su presentación
- A. Prueba del retraso de la adquisición
- B. Prueba de dificultad de emparejamiento
- C. Prueba del estímulo compuesto (o de sumación)
- D. No hay forma de medir la inhibición condicionada
La prueba del retraso de la adquisición es un procedimiento que identifica a un estímulo como inhibidor acondicionado si es más lento para adquirir propiedades excitatorias que un estímulo de comparación. Verdadero
La prueba de retraso de la adquisición es un procedimiento de prueba que identifica un estímulo como inhibidor acondicionado si éste reduce la respuesta provocada por un estímulo acondicionado excitatorio. Falso
47. ¿Qué procedimiento implica que un segundo estímulo condicional no tiene la misma capacidad de aprendizaje porque se presenta con otro estímulo condicional de mayor saliencia?
- A. Sombra
- B. Inhibición latente
- C. Pre-exposición de la EC
- D. Bloqueo
29. Una paloma pica un botón, 3 segundos después pica en el botón y recibe un pelet de comida, 6 segundos después pica en el botón y no obtiene nada, 2 segundos después pica el botón y recibe un pelet de comida, etc. ¿Qué procedimiento estamos utilizando?
- A. Reforzamiento de tasas de respuesta lenta
- B. Reforzamiento de tasas de respuesta rápida
- C. Intervalo fijo
- D. Razón variable
7. ¿Cómo se llama el procedimiento en el que se presenta un EC2 que funciona como un inhibidor natural tanto del EI como del EC1?
- A. Precondicionamiento sensorial.
- B. Acondicionamiento clásico excitador.
- C. Acondicionamiento clásico inhibitorio de contingencia negativa.
- D. Acondicionamiento clásico inhibitorio estándar.
8. ¿Cuál es el procedimiento más eficaz para generar un aprendizaje asociativo por condicionamiento clásico?
- A. El simultáneo.
- B. El demorado.
- C. El demorado, debido a que se produce un intervalo de huella.
- D. El de huella, debido a que se produce un intervalo de huella.
15. El estímulo que al inicio no provoca una respuesta particular, pero llega a hacerlo como resultado de su asociación con un estímulo incondicionado, una vez se ha producido esta asociación se llama inicialmente…
- A. Incondicionado
- B. Condicionado
- C. Adquirido
- D. Neutro
26. ¿Qué tipo de respuesta es la que podríamos predecir que se produce habitualmente después de aplicar cualquier procedimiento de CI?
- A. Variabilidad de respuesta
- B. Potenciación de conducta
- C. Reducción de conducta
- D. Respuesta estereotipada
34. ¿Cómo se define la tasa relativa de reforzamiento?
- A. Cantidad de refuerzo que se da en una opción respecto al total.
- B. Cantidad de refuerzo que se da en una opción respecto a la cantidad de refuerzo que se da en la otra opción.
- C. Cantidad de conducta que se hace en una opción respecto al total.
- D. Calidad de refuerzo que se da en una opción respecto al total.
31. En la fase 1 (aprendizaje) del procedimiento de indefensión aprendida…
- A. Un grupo puede escapar de la corriente apretando un botón, otro grupo no puede escapar botón aunque apriete el botón y un grupo control puede escapar algunas vueltas aprendiendo el botón.
- B. Un grupo puede escapar de la corriente apretando un botón y otro grupo no puede escapar aunque apriete el botón.
- C. Un grupo no puede escapar aunque apriete el botón y un grupo control no recibe ningún tipo de corriente.
- D. Un grupo puede escapar de la corriente apretando un botón, otro grupo no puede escapar aunque apriete el botón y un grupo control no recibe ningún tipo de corriente.
32. ¿Cuál es la conclusión básica que se extrae del experimento que Skinner hizo sobre reforzamiento accidental y que dio lugar a la superstición de la paloma?
- A. La contigüidad temporal es el factor fundamental para el aprendizaje.
- B. Debido a efectos de contingencia, cada paloma asociaba el refuerzo a una conducta diferente.
- C. Las palomas repetían las conductas debido a la contigüidad temporal entre su conducta y el refuerzo.
- D. Cada paloma repetía una conducta diferente debido a que cada uno recibía el refuerzo con una contigüidad temporal diferente.
36. A Sara le gustan mucho los juegos de mesa. En casa hay una norma, y es que cuando se empieza a jugar a un juego de mesa, debe acabar. No se puede dejar a medias ni se cambia de juego. Su padre le propone elegir entre Marco Polo, juego de gestión de recursos donde estarán cerca de 120 minutos jugando y que recibe premios durante la partida cuando se van alcanzando objetivos, y Kitchen Rush, juego cooperativo en el que cada ronda se juega a 4 minutos y se consiguen puntos al final de cada una. Desde el punto de vista del aprendizaje asociativo, ¿qué tipo de tarea se está explicando en este caso?
- A. Programa concurrente encadenado
- B. Dos procedimientos básicos de acondicionamiento instrumental, ambos de reforzamiento positivo.
- C. Programa concurrente
- D. Dos programas de reforzamiento simple, uno de razón y otro de intervalo.
37. Carmen tiene dos gatos, Cugui e Ironman. Carmen juega muy a menudo con Cuqui, porque muy a menudo la gata entra en el juego y eso le hace sentir muy bien a Carmen. Con Ironman, su gato, juega menos porque cuando Carmen empieza a interactuar con él, el gato pasa de ella. Carmen siempre tiene libertad para intentar jugar con uno u otro sin ningún tipo de restricción. ¿Qué está operando en este caso?
- A. Ley de infraigualación, porque juega menos con el Ironman que con la Cuqui.
- B. Ley de supraigualación, porque juega más con la Cuqui que con el Ironman.
- C. Programa de reforzamiento de razón, porque Carmen recibe la atención de los gatos cuando hace la conducta de jugar con ellos.
- D. Ley de igualación, porque juega más con la gata que le hace más caso.
41. En el experimento de Eisenberg y Adornetto (1986) sobre el aprendizaje de autocontrol de los niños, ¿en qué condición mostraban a los niños que habían mejorado en su autocontrol?
- A. En los que al pre-test querían un gran refuerzo demorado y fueron entrenados dándoles un pequeño refuerzo inmediato con manchas difíciles.
- B. En los que al pre-test querían un pequeño refuerzo inmediato y fueron entrenados dándoles un gran refuerzo demorado con manchas difíciles.
- C. En los que al pre-test querían un pequeño refuerzo inmediato y fueron entrenados dándoles un gran refuerzo demorado con manchas fáciles.
- D. En los que al pre-test querían un gran refuerzo demorado y fueron entrenados dándoles un gran refuerzo demorado con manchas fáciles.
42. Según la evidencia empírica de que disponemos actualmente, elige el procedimiento que NO se ha demostrado que sirva para mejorar el autocontrol desde el acondicionamiento instrumental.
- A. Decirte mensajes positivos a ti mismo/a como refuerzo positivo.
- B. Caminar por la naturaleza mientras tomas la decisión.
- C. Pensar en actividades específicas que harías dentro de un tiempo con el dinero que ganarías.
- D. Hacer explícito lo implícito.
44. Nilo tiene un loro que sabe cantar el himno del Real Madrid. Ahora quiere enseñarle a cantarlo cuando vea el escudo del Barça. Para conseguirlo, le enseña el escudo del Barça y, cuando el loro canta el himno del Real Madrid, le da su laminadura favorita. Desde la teoría moderna de los dos procesos, entre qué elementos del procedimiento de acondicionamiento instrumental se está produciendo ¿una asociación de ACONDICIONAMIENTO CLÁSICO?
- A. Entre cantar el himno del Real Madrid y la golosina favorita.
- B. Entre cantar el himno del Real Madrid y la intención del Nilo de enseñar al loro.
- C. Entre el escudo del Barça y la golosina favorita.
- D. Entre el escudo del Barça y cantar el himno del Real Madrid.
44. Nilo tiene un loro que sabe cantar el himno del Real Madrid. Ahora quiere enseñarle a cantarle cuando vea el escudo del Barça. Para ello, le enseña el escudo del Barça y, cuando el loro canta el himno del Real Madrid, le da su laminadura favorita. Desde la teoría moderna de los dos procesos, ¿entre qué elementos del procedimiento de acondicionamiento instrumental se está produciendo una asociación de ACONDICIONAMIENTO INSTRUMENTAL (LEY DE THORNDIKE)?
- A. Entre cantar el himno del Real Madrid y las ganas de enseñarle al loro.
- B. Entre el escudo del Barça y cantar el himno del Real Madrid.
- C. Entre cantar el himno del Real Madrid y la laminadura favorita.
- D. Entre el escudo del Barça y la golosina favorita.
45. A María le gusta poco jugar a juegos de mesa, pero leer le gusta mucho. Según el principio de Premack, cómo debería ordenar estas actividades para que María se motive cada vez más a hacer…
- A. Le haré jugar a juegos de mesa primero y después leer, ya que leer es la conducta más probable.
- B. Le haré leer primero y después jugar a juegos de mesa para cumplir con la ley de igualación.
- C. Le haré leer primero y después jugar a juegos de mesa, ya que jugar a juegos de mesa es la conducta más probable.
- D. Le haré jugar a juegos de mesa primero y después leer, ya que jugar a juegos de mesa es la conducta más probable.
46. Elige la opción correcta sobre los factores que modulan la generalización de los aprendizajes.
- A. Todos los reforzadores (o castigos) son igual de eficaces para generar aprendizaje.
- B. Todas las respuestas se pueden asociar a todo tipo de estímulos con igual facilidad.
- C. Hay reforzadores con los que más se aprende cuando se asocian a un estímulo en concreto, como por ejemplo, reforzador apetitivo con estímulos visuales.
- D. Se produce la generalización porque todos los estímulos neutros tienen la misma capacidad asociativa, independientemente de su saliencia o de la exposición previa a ellos.