El intervalo entre recompensas es clave para el aprendizaje, según un estudio

Una investigación con ratones de la Universidad de California en San Francisco sostiene que el intervalo regular entre estímulos y recompensas influye más en el aprendizaje asociativo. Los detalles de un estudio publicado en Nature Neuroscience

Un estudio de la Universidad de California en San Francisco sugiere que el tiempo entre recompensas, y no la repetición, impulsa el aprendizaje asociativo (Imagen Ilustrativa Infobae)

Hace más de cien años, el experimento de Iván Pavlov con perros sentó las bases del aprendizaje asociativo. Desde entonces, la dopamina fue considerada el elemento químico responsable de consolidar la relación entre estímulo y recompensa. Sin embargo, recientes investigaciones de la Universidad de California en San Francisco, una de las principales instituciones de investigación en neurociencia, desafían la primacía de la repetición en este proceso, planteando que el intervalo entre recompensas es el verdadero motor del aprendizaje.

Según explicó Vijay Mohan K. Namboodiri, profesor asociado de Neurología y autor principal del estudio publicado en la revista científica Nature Neuroscience, el tiempo entre cada asociación señal-recompensa permite al cerebro decidir la magnitud del aprendizaje a extraer de cada experiencia.

La investigación, liderada por Namboodiri junto al investigador postdoctoral Dennis Burke, consistió en entrenar ratones para asociar un sonido con la llegada de agua azucarada, modificando los intervalos entre cada oportunidad de aprendizaje.

Los investigadores proponen que algoritmos inspirados en estos mecanismos cerebrales podrían hacer que la inteligencia artificial aprenda con menos experiencias (Imagen Ilustrativa Infobae)

Algunos ratones se enfrentaron a pruebas cada pocos segundos, mientras que otros debieron esperar hasta diez minutos entre ensayos. Los resultados mostraron que los animales con más recompensas en menos tiempo no aprendían más rápido que aquellos con pruebas espaciadas y menos recompensas.

Resultados y significancia del intervalo temporal

Contrario a la creencia clásica, basada en la noción de que cuanto mayor la cantidad de repeticiones, mayor el aprendizaje, los datos experimentales indican otra dirección. Burke precisó: el aprendizaje asociativo es menos la práctica hace al maestro y más el tiempo lo es todo.

En los experimentos, incluso cuando los ratones recibieron solo un 10% de recompensas tras la señal, si los intervalos eran regulares, su liberación de dopamina ante la señal ocurrió mucho antes que en animales sometidos a muchas repeticiones concentradas. Cuando las recompensas están más separadas, el aprendizaje se acelera, lo que desafía la idea de que la exposición intensiva siempre produce mejores resultados. Este hallazgo sugiere que el cerebro regula cuánto aprende en función del intervalo temporal entre experiencias, y no solo por la cantidad de veces que se presenta un estímulo.

Investigadores entrenaron ratones para asociar sonidos con recompensas y comprobaron que intervalos regulares mejoran la eficacia del aprendizaje (Imagen Ilustrativa Infobae)

Las implicaciones trascienden la neurobiología animal. Namboodiri vinculó este fenómeno con estrategias de estudio en humanos: el espaciado de las sesiones de aprendizaje puede favorecer una mejor consolidación de la información, lo que explicaría por qué los estudiantes que distribuyen su estudio a lo largo del semestre suelen tener mejores resultados que quienes concentran la preparación antes de los exámenes.

En cuanto a las adicciones, el equipo de la Universidad de California en San Francisco destaca que señales intermitentes, como ciertos olores o imágenes asociadas al cigarrillo, pueden reforzar el deseo de fumar. El estudio indica: “Un parche de nicotina administra nicotina de forma constante, lo que puede alterar la asociación cerebral entre la nicotina y la recompensa de dopamina resultante, mitigando el deseo de fumar y facilitando el abandono”.

El equipo ya explora aplicaciones tecnológicas. Los sistemas de inteligencia artificial actuales, sustentados en modelos tradicionales de aprendizaje asociativo, requieren numerosas experiencias para optimizar su rendimiento.

amboodiri anticipó: “Un modelo basado en lo que hemos descubierto podría potencialmente aprender más rápido con menos experiencias”. Aunque la brecha entre el aprendizaje humano y el de las máquinas persiste, estos hallazgos abren la puerta a algoritmos más eficientes inspirados en el cerebro.

