
Durante décadas, la dopamina ha sido considerada el neurotransmisor clave en el aprendizaje basado en recompensas. Sin embargo, un estudio publicado en Nature el 14 de mayo por un equipo de neurocientíficos del Instituto de Genómica Funcional de Montpellier (Inserm, CNRS) redefine este papel. En su investigación han demostrado que esta hormona también refuerza los hábitos mediante un mecanismo independiente del valor de la recompensa. Esta segunda vía permite que los individuos repitan acciones pasadas de forma automática, incluso sin obtener un beneficio inmediato.
“La dopamina relacionada con el movimiento puede actuar como una señal de enseñanza libre de valores que apoya el aprendizaje, reforzando asociaciones repetidas”, explican los autores. Esta idea, derivada de experimentos con ratones y modelos computacionales, permite comprender cómo se forman los hábitos como automatismos estables, al margen de los incentivos.
PUBLICIDAD
¿Qué sistema de aprendizaje tiene una mayor relación con la señal dopaminérgica?
Cuando humanos y animales toman decisiones, tienden a repetir comportamientos que han resultado exitosos y también aquellos que simplemente han ejecutado con anterioridad. El estudio revela que estas dos estrategias dependen de señales dopaminérgicas distintas: por un lado, el error de predicción de recompensa (RPE), que refuerza conductas asociadas al valor del resultado; por otro, el error de predicción de acción (APE), que fortalece la repetición de acciones previas sin tener en cuenta si fueron recompensadas. Mediante una tarea de discriminación auditiva, los investigadores observaron que la actividad de la dopamina en la cola del cuerpo estriado (TS) no produce recompensa ni respuesta sensorial, sino movimiento. A lo largo del aprendizaje, esa señal disminuye, lo que indica que se ajusta a la previsibilidad de la acción.
Cuanto más predecible es una acción ante un estímulo, menor es la señal dopaminérgica, en línea con lo que predice el segundo modelo: “Nuestros resultados revelan que la señal dopaminérgica del TS relacionada con el movimiento es consistente con la codificación de APE”, señala el estudio. El equipo dirigido por Jérémie Naudé comprobó que los ratones eran más propensos a repetir una acción si la señal de dopamina en el TS era alta durante la elección anterior, incluso cuando no obtenían recompensa.
PUBLICIDAD

Además, mediante estimulación optogenética, es decir, al insertar información genética en células cerebrales, se logró imitar la liberación natural de dopamina en esta región y observaron cómo los animales sesgaban su comportamiento hacia la repetición, sin necesidad de resultados de recompensa. De esta manera se establece que “estimular la liberación de dopamina en el TS puede reforzar asociaciones estado-acción, pero no estado-resultado”. Así, se descarta que este tipo de dopamina afecte directamente al movimiento o al placer. Por el contrario, su función sería consolidar patrones de conducta repetidos, lo que permite automatizar acciones y liberar recursos cognitivos para otras tareas.
A nivel teórico, el trabajo propone un modelo de aprendizaje dual: uno basado en valores, que evalúa las consecuencias de cada acción, y otro libre de valores, que refuerza la repetición de asociaciones pasadas. Mientras que el primero permite una conducta flexible y adaptativa, el segundo consolida respuestas estables. Combinados, ambos sistemas permiten un aprendizaje más rápido y robusto. Este modelo explica por qué ciertos hábitos se mantienen incluso cuando la recompensa desaparece.
PUBLICIDAD
También sugiere que, en fases tempranas del aprendizaje, el sistema dopaminérgico basado en recompensa domina, pero con el tiempo el control se transfiere al sistema habitual, más eficiente para entornos predecibles. Más allá de lo explicado, los experimentos descartaron que esta señal esté relacionada con respuestas a estímulos sensoriales, amenazas o novedad. Por ejemplo, cuando se reprodujo un sonido desconocido durante la tarea, la respuesta dopaminérgica aumentó únicamente si implicaba una acción familiar no predicha por ese nuevo estímulo. Esto respaldaría la idea de que el APE mide la diferencia entre lo que se hace y lo que se espera hacer.
Implicaciones para la neurociencia del hábito
Desde una perspectiva evolutiva, este sistema ofrece ventajas claras. Automatizar respuestas ante situaciones repetidas, ahorra recursos y acelera la toma de decisiones. Como recuerda el neurocientífico Jérémie Naudé: “Los hábitos permiten actuar sin pensar. Debieron tener ventajas evolutivas, facilitando la supervivencia en entornos variables”.
PUBLICIDAD
El hallazgo tiene implicaciones en campos como el estudio de trastornos compulsivos, adicciones o rutinas motoras en enfermedades neurodegenerativas. También ofrece nuevas claves sobre cómo romper hábitos no deseados: no basta con modificar el valor percibido de una acción, sino que hay que interferir con las señales que refuerzan su repetición.
En conjunto, esta investigación redefine el papel de la dopamina en el aprendizaje y aporta un nuevo marco para entender cómo el cerebro consolida comportamientos automáticos. Más allá del placer, la dopamina enseña a actuar por repetición. O, como ya intuía el filósofo Alain en 1955: “El hábito: un arte de actuar sin pensarlo y mejor aún que pensarlo”.
PUBLICIDAD
PUBLICIDAD
PUBLICIDAD
Últimas Noticias
Rosa María Calaf se embolsa 30.000 euros con el Premio Nacional de Televisión 2026: coge el testigo de Jordi Hurtado tras su extensa trayectoria en RTVE
El jurado la ha elegido a la periodista por unanimidad por su “mirada feminista, diversa, capaz de anticipar temáticas y estilos de plena actualidad”

Estos son los artistas que actuarán en ‘La Velada del Año VI’: de Juanes a Bad Gyal y Anuel AA, que repite tras ser abucheado en la cuarta edición
Ibai Llanos ha confirmado el cartel musical del evento, que se celebrará el próximo 25 de julio en el Estadio de La Cartuja de Sevilla

Triplex de la Once: jugada ganadora y resultado del sorteo 4
Juegos Once difundió la combinación ganadora del Sorteo 4 de las 17:00 horas. Tenemos los números ganadores aquí mismo

Se vende uno de los castillos más famosos de Suiza: casi 20 millones de euros por un edificio de 1750 construido a orillas del lago Lemán
El castillo de Choulex, a orillas del lago Lemán, se suma a una lista de propiedades históricas suizas en venta, entre ellas el hotel-castillo Gütsch de Lucerna, cuyo propietario ruso pide 35 millones de francos por un inmueble que no encuentra comprador


