Revista Ciencia

Aprendizaje por condicionamiento: de Pavlov a Albert B.

Por Davidsaparicio @Psyciencia
Psychology en Shutterstock" href="https://www.psyciencia.com/wp-content/uploads/2016/11/shutterstock_353614217.jpg">Aprendizaje por condicionamiento: de Pavlov a Albert B.Psychology en Shutterstock

Se define aprendizaje por condicionamiento como el proceso por medio del cual se efectúa un cambio en la conducta a través de la experiencia o la asociación de eventos o estímulos. 

La capacidad de aprender posibilita la adaptación de todo individuo a los cambios del entorno y el reconocimiento de las señales del mundo externo. Desde luego, se distinguen diferencias importantes entre los modelos de aprendizaje por condicionamiento clásico y condicionamiento operante. 

Este artículo propone un recorrido histórico y conceptual de ambos enfoques. 

El aprendizaje según el conductismo

Teoría del condicionamiento clásico

La teoría del condicionamiento clásico deriva de los experimentos del fisiólogo ruso Iván Pavlov, quien durante el estudio del aparato digestivo canino notó que los animales salivaban al ser expuestos a estímulos asociados con la comida sin que fuera necesaria la presencia física de esta.

El sonar de una campana o los pasos de los investigadores bastaban para desencadenar un mecanismo fisiológico en los perros relacionado con la primera fase de la digestión, lo que llevó a Pavlov a dirigir su investigación hacia una importante conclusión científica: los perros salivaban al escuchar la campana porque habían aprendido que el sonido de esta precedía la alimentación, por lo cual la respuesta inmediata a nivel orgánico era la preparación de las glándulas salivales.

En este proceso de condicionamiento intervenían factores clave:

  • El estímulo incondicionado (EI), que viene siendo aquel que produce invariablemente una reacción (en este caso, la comida).
  • La respuesta incondicionada (RI), que es provocada por el estímulo incondicionado (la salivación).
  • El estímulo condicionado (EC), que se considera neutro porque no produce ninguna respuesta al menos que se haya dado el pareamiento (la campana).
  • La respuesta condicionada (RC), que es el resultado de mezclar el estímulo incondicionado y el estímulo condicionado (comida + campana = salivación al escuchar la campana).

El aprendizaje por condicionamiento clásico es una de las teorías más trascendentales de la psicología científica, y también una de las más polémicas en cuanto sirvió de base para realizar experimentos en humanos, algo que, por supuesto, tuvo mucho que ver con el Manifiesto impulsado por John B. Watson.  

Antes de un Manifiesto Conductista formalmente planteado, la psicología limitaba sus experimentos a los animales. Fue John B. Watson quien se refirió por escrito a una necesidad inaplazable de abandonar esta parcialización para realizar estudios integrales de los procesos conductuales en el individuo.

El aprendizaje por condicionamiento clásico es una de las teorías más trascendentales de la psicología científica, y también una de las más polémicas

Partiendo del condicionamiento y con el trasfondo del conductismo manifiesto, Watson encabezó el experimento de Douglas Merritte, apodado “Albert B” o “Pequeño Alberto”, cuyo objetivo era instaurar una fobia a las ratas blancas y a los objetos peludos en un niño de 9 meses mediante condicionamiento clásico empleando como estímulo condicionado el sonar de una vara de metal al ser azotada contra la pared, a la vez que se mostraba al niño la rata blanca y los ítems peludos. 

El condicionamiento del Pequeño Alberto impulsó una serie de investigaciones experimentales sobre el aprendizaje en sujetos humanos, entre ellas, investigaciones acerca de la erradicación de las fobias y el tratamiento de la ansiedad.   

Reseña del experimento del Pequeño Alberto 

Teoría del Condicionamiento Operante

Posterior al condicionamiento clásico, se desarrolló una variante que introdujo factores llamados reforzadores (recompensas o castigos), con el propósito de reafirmar una conducta deseada o suprimir una indeseada.

A esta versión impulsada principalmente por Thorndike y Skinner, se le conoce como condicionamiento operante o instrumental.

El condicionamiento operante propone, entonces, que el sujeto no aprende por un mero estímulo con base en necesidades biológicas (como ser alimentado) sino que es necesario aplicar el uso de reforzadores positivos (recompensas) o refuerzo negativo, que consiste en la sustracción de un elemento dentro del esquema de aprendizaje que baste para “persuadir” al individuo de dar continuidad a la conducta deseada.

Así, un ejemplo sería el condicionamiento operante de un niño para aumentar sus horas de estudio de piano mediante refuerzo positivo (premiándolo con su dulce favorito) o refuerzo negativo (diciéndole que no tendrá que hacer alguna tarea asignada previamente si dedica más horas de estudio al piano).

Además de los reforzadores como método para “cuajar” el aprendizaje de una conducta deseada, el condicionamiento operante considera el empleo del castigo con una función de debilitamiento de una conducta indeseada, mediante la adición de un elemento desagradable al esquema de aprendizaje.

El condicionamiento operante propone que el sujeto no aprende por un mero estímulo biológico, sino que es necesario aplicar refuerzos o castigos

Dentro del condicionamiento operante también hallamos la conducta supersticiosa, que implica que los individuos tienden a repetir aquellas acciones (aunque fortuitas) previas al recibimiento de un refuerzo positivo (recompensa), o que hayan sido relacionadas con este.

Por ejemplo, un sujeto puede adoptar la conducta supersticiosa de vestir todos los días el mismo pantalón si llevándolo puesto, con anterioridad, tuvo la fortuna de encontrarse un billete de cien dólares. 

Otro fenómeno que forma parte del condicionamiento operante es el desamparo aprendido. Este consiste en una incapacidad adquirida para el aprendizaje de ciertas conductas que involucran la obtención de una recompensa o evitan un estímulo aversivo.

Un ejemplo muy popular es la investigación experimental realizada con dos grupos de perros (uno de control y otro experimental), en la cual el primero era sometido a descargas eléctricas (castigo) con la posibilidad de suspender las descargas presionando un botón con la nariz.

El grupo experimental, mientras tanto, era sujeto a las mismas condiciones salvo que no era posible detener las descargas.

Más adelante, se encontró que el grupo de control aprendía con mayor facilidad en circunstancias semejantes y que el grupo experimental no solo tenía dificultades para aprender sino que presentaba síntomas asociados con la depresión humana.

Esto sugiere una influencia considerable de las experiencias negativas en el proceso de aprendizaje.

El condicionamiento operante puede ser utilizado para modificar rasgos conductuales de carácter biológico como el ritmo cardíaco y la temperatura corporal, técnica llamada biorretroalimentación, al igual que para erradicar males como la ansiedad y problemas de concentración mediante el monitoreo y control de las ondas encefálicas, procedimiento que recibe el nombre de neurorretroalimentación.

¿Cuándo tiempo permanece el aprendizaje por condicionamiento?

La extinción y recuperación del aprendizaje depende de si somos capaces de vencer la interferencia

El tiempo de adquisición del aprendizaje varía según la conducta instaurada.

Puede distinguirse entre conductas naturales (en términos biológicos, como la salivación en los perros de Pavlov) y conductas adquiridas (como enseñar a un gato a saltar de silla en silla). El aprendizaje de conductas de origen biológico, desde luego, conlleva un periodo de adquisición menor que el aprendizaje de conductas no biológicas.

Pero una vez cuajado el aprendizaje, ¿qué ocurre? ¿Durante cuánto tiempo se conserva? ¿Cómo se extingue y se recupera una conducta?

Supongamos que un niño teme al sonido de la puerta principal por las noches porque sabe que su padre llegará alcoholizado y golpeará a su madre. Más adelante, el matrimonio se disuelve y el niño se queda con su madre mientras que el padre se marcha. Transcurren unos meses sin que el niño escuche el sonido de la puerta principal por las noches, pero si de pronto, fortuitamente, la llegada de una visita coincidiera con el horario en que solía llegar el padre, el niño probablemente volvería a sentir miedo, aunque a una escala menor. 

Lo mismo ocurre con el condicionamiento operante, salvo que se introduce la interferencia (estímulos falsos) que pudieran darse en el proceso de extinción ante la ausencia de reforzamiento.

Si le enseñamos a un gato a saltar de silla en silla reforzándolo con un bocadillo pero eventualmente dejamos de recompensarlo al completar el ejercicio, es muy probable que poco a poco deje de hacerlo o que opte por una conducta distinta, como caminar sobre la mesa.

La extinción y recuperación del aprendizaje, en este caso, depende de si somos capaces de vencer la interferencia

El dinero es un reforzador secundario por excelencia, ya que se asocia con todos los reforzadores primarios

Otros elementos que fungen una función importante durante el condicionamiento, ya sea clásico u operante, son la generalización y la discriminación.

El primero de estos se refiere, como su nombre lo indica, a una concepción universal del estímulo o respuesta en cuestión que puede llevar a un condicionamiento drástico. Por ejemplo, en el experimento de Pequeño Alberto se dio una asociación que llevó al sujeto a desarrollar fobia a las ratas blancas y peludas, pero también a cualquier objeto blanco y peludo (generalización de estímulo, porque se universaliza el EI).

En el condicionamiento operante ocurre lo mismo: el gato que aprende a saltar de silla en silla porque se le da un bocadillo puede verse saltando también de mesa en mesa, esperando obtener la misma recompensa. Al menos que esta se dé únicamente cuando salta de silla en silla, que era la conducta a aprender inicialmente, se da una generalización de respuesta.

Además de los factores estímulo-respuesta o estímulo-respuesta-reforzamiento observados según el tipo de condicionamiento, es interesante la posibilidad de aplicar un condicionamiento de orden superior, mediante el cual se introduce un nuevo objeto en función de EC y el EC original es utilizado como EI. Por ejemplo: Pavlov empleó como EI una campana (originalmente empleada como EC) y como EC, un cuadrado negro que al ser mostrado previamente al sonar de la campana producía salivación.

Existen también los reforzadores secundarios, que se determinan tras haber sido asociados con reforzadores de tipo primario: comida, agua y sexo.

El dinero, por ejemplo, es un reforzador secundario por excelencia, ya que se asocia con todos los reforzadores primarios.

También es importante la contingencia de los hechos condicionantes, la cual consiste en el establecimiento necesario de una relación causal entre el EI y el EC, de manera que el sujeto pueda dar por sentado que una cosa precede a la otra.

En el experimento de Pavlov es fundamental que el EC (la campana) preceda al EI (comida) para que de este modo los perros aprendan que el sonido de la campana anuncia el alimento y, eventualmente, saliven con sólo oír la campana.

Puede darse también que el EC sea posterior al EI, en este caso: que la campana suene luego de haber alimentado a los perros. Bajo estas condiciones, se habla de un condicionamiento para atrás y el objetivo del aprendizaje consiste en instaurar en el sujeto experimental, en lugar de un estado de alerta, un estado de relajación. 

Referencias: APA | Revistas UNAM


Volver a la Portada de Logo Paperblog