
Durante décadas, la dopamina ha sido considerada el neurotransmisor clave en el aprendizaje basado en recompensas. Sin embargo, un estudio publicado en Nature el 14 de mayo por un equipo de neurocientíficos del Instituto de Genómica Funcional de Montpellier (Inserm, CNRS) redefine este papel. En su investigación han demostrado que esta hormona también refuerza los hábitos mediante un mecanismo independiente del valor de la recompensa. Esta segunda vía permite que los individuos repitan acciones pasadas de forma automática, incluso sin obtener un beneficio inmediato.
“La dopamina relacionada con el movimiento puede actuar como una señal de enseñanza libre de valores que apoya el aprendizaje, reforzando asociaciones repetidas”, explican los autores. Esta idea, derivada de experimentos con ratones y modelos computacionales, permite comprender cómo se forman los hábitos como automatismos estables, al margen de los incentivos.
¿Qué sistema de aprendizaje tiene una mayor relación con la señal dopaminérgica?
Cuando humanos y animales toman decisiones, tienden a repetir comportamientos que han resultado exitosos y también aquellos que simplemente han ejecutado con anterioridad. El estudio revela que estas dos estrategias dependen de señales dopaminérgicas distintas: por un lado, el error de predicción de recompensa (RPE), que refuerza conductas asociadas al valor del resultado; por otro, el error de predicción de acción (APE), que fortalece la repetición de acciones previas sin tener en cuenta si fueron recompensadas. Mediante una tarea de discriminación auditiva, los investigadores observaron que la actividad de la dopamina en la cola del cuerpo estriado (TS) no produce recompensa ni respuesta sensorial, sino movimiento. A lo largo del aprendizaje, esa señal disminuye, lo que indica que se ajusta a la previsibilidad de la acción.
Cuanto más predecible es una acción ante un estímulo, menor es la señal dopaminérgica, en línea con lo que predice el segundo modelo: “Nuestros resultados revelan que la señal dopaminérgica del TS relacionada con el movimiento es consistente con la codificación de APE”, señala el estudio. El equipo dirigido por Jérémie Naudé comprobó que los ratones eran más propensos a repetir una acción si la señal de dopamina en el TS era alta durante la elección anterior, incluso cuando no obtenían recompensa.

Además, mediante estimulación optogenética, es decir, al insertar información genética en células cerebrales, se logró imitar la liberación natural de dopamina en esta región y observaron cómo los animales sesgaban su comportamiento hacia la repetición, sin necesidad de resultados de recompensa. De esta manera se establece que “estimular la liberación de dopamina en el TS puede reforzar asociaciones estado-acción, pero no estado-resultado”. Así, se descarta que este tipo de dopamina afecte directamente al movimiento o al placer. Por el contrario, su función sería consolidar patrones de conducta repetidos, lo que permite automatizar acciones y liberar recursos cognitivos para otras tareas.
A nivel teórico, el trabajo propone un modelo de aprendizaje dual: uno basado en valores, que evalúa las consecuencias de cada acción, y otro libre de valores, que refuerza la repetición de asociaciones pasadas. Mientras que el primero permite una conducta flexible y adaptativa, el segundo consolida respuestas estables. Combinados, ambos sistemas permiten un aprendizaje más rápido y robusto. Este modelo explica por qué ciertos hábitos se mantienen incluso cuando la recompensa desaparece.
También sugiere que, en fases tempranas del aprendizaje, el sistema dopaminérgico basado en recompensa domina, pero con el tiempo el control se transfiere al sistema habitual, más eficiente para entornos predecibles. Más allá de lo explicado, los experimentos descartaron que esta señal esté relacionada con respuestas a estímulos sensoriales, amenazas o novedad. Por ejemplo, cuando se reprodujo un sonido desconocido durante la tarea, la respuesta dopaminérgica aumentó únicamente si implicaba una acción familiar no predicha por ese nuevo estímulo. Esto respaldaría la idea de que el APE mide la diferencia entre lo que se hace y lo que se espera hacer.
Implicaciones para la neurociencia del hábito
Desde una perspectiva evolutiva, este sistema ofrece ventajas claras. Automatizar respuestas ante situaciones repetidas, ahorra recursos y acelera la toma de decisiones. Como recuerda el neurocientífico Jérémie Naudé: “Los hábitos permiten actuar sin pensar. Debieron tener ventajas evolutivas, facilitando la supervivencia en entornos variables”.
El hallazgo tiene implicaciones en campos como el estudio de trastornos compulsivos, adicciones o rutinas motoras en enfermedades neurodegenerativas. También ofrece nuevas claves sobre cómo romper hábitos no deseados: no basta con modificar el valor percibido de una acción, sino que hay que interferir con las señales que refuerzan su repetición.
En conjunto, esta investigación redefine el papel de la dopamina en el aprendizaje y aporta un nuevo marco para entender cómo el cerebro consolida comportamientos automáticos. Más allá del placer, la dopamina enseña a actuar por repetición. O, como ya intuía el filósofo Alain en 1955: “El hábito: un arte de actuar sin pensarlo y mejor aún que pensarlo”.
Últimas Noticias
Precio de la gasolina hoy en España: las tarifas más altas y más bajas
Aquí también están los precios de las gasolinas en Valencia, Zaragoza, Málaga y Sevilla

Z, el artista fallero chileno que ha hecho historia en las Fallas de Valencia: “La Cremà es nuestro año nuevo, una noche mágica en la que se quema todo y se cierra un ciclo”
Zvonimir Ostoic, de 54 años, ha conseguido el primer premio a la falla infantil de la Comisión Espartero-Gran Vía Ramón y Cajal y el ninot indultat de 2026

El papel de las empresas españolas en Ucrania: estos son los contactos y proyectos que se han ido tejiendo desde el inicio de la guerra
Antes del acuerdo de coproducción, la relación entre la industria española y Ucrania ya se había ido consolidando a través de acuerdos y contactos

Virgen, extra y lampante: estos son los precios del aceite de oliva hoy jueves 19 de marzo
La cotización de este producto han mostrado cambios importantes por diversos factores, desde lluvias y sequías, hasta abundancias y bajas de cosecha

Dime qué edad tienes y te diré cuán importante eres para el Estado del bienestar: los nacidos entre 1965 y 1998 reciben menos de lo que aportan
Quienes se sitúan entre los 28 y los 61 años reciben de media un 18% menos en transferencias públicas de lo que aportan en renta, mientras que los menores de 28 años y los mayores de 62 años son beneficiarios netos del sistema, según Fedea

