
Durante décadas, la dopamina ha sido considerada el neurotransmisor clave en el aprendizaje basado en recompensas. Sin embargo, un estudio publicado en Nature el 14 de mayo por un equipo de neurocientíficos del Instituto de Genómica Funcional de Montpellier (Inserm, CNRS) redefine este papel. En su investigación han demostrado que esta hormona también refuerza los hábitos mediante un mecanismo independiente del valor de la recompensa. Esta segunda vía permite que los individuos repitan acciones pasadas de forma automática, incluso sin obtener un beneficio inmediato.
“La dopamina relacionada con el movimiento puede actuar como una señal de enseñanza libre de valores que apoya el aprendizaje, reforzando asociaciones repetidas”, explican los autores. Esta idea, derivada de experimentos con ratones y modelos computacionales, permite comprender cómo se forman los hábitos como automatismos estables, al margen de los incentivos.
¿Qué sistema de aprendizaje tiene una mayor relación con la señal dopaminérgica?
Cuando humanos y animales toman decisiones, tienden a repetir comportamientos que han resultado exitosos y también aquellos que simplemente han ejecutado con anterioridad. El estudio revela que estas dos estrategias dependen de señales dopaminérgicas distintas: por un lado, el error de predicción de recompensa (RPE), que refuerza conductas asociadas al valor del resultado; por otro, el error de predicción de acción (APE), que fortalece la repetición de acciones previas sin tener en cuenta si fueron recompensadas. Mediante una tarea de discriminación auditiva, los investigadores observaron que la actividad de la dopamina en la cola del cuerpo estriado (TS) no produce recompensa ni respuesta sensorial, sino movimiento. A lo largo del aprendizaje, esa señal disminuye, lo que indica que se ajusta a la previsibilidad de la acción.
Cuanto más predecible es una acción ante un estímulo, menor es la señal dopaminérgica, en línea con lo que predice el segundo modelo: “Nuestros resultados revelan que la señal dopaminérgica del TS relacionada con el movimiento es consistente con la codificación de APE”, señala el estudio. El equipo dirigido por Jérémie Naudé comprobó que los ratones eran más propensos a repetir una acción si la señal de dopamina en el TS era alta durante la elección anterior, incluso cuando no obtenían recompensa.

Además, mediante estimulación optogenética, es decir, al insertar información genética en células cerebrales, se logró imitar la liberación natural de dopamina en esta región y observaron cómo los animales sesgaban su comportamiento hacia la repetición, sin necesidad de resultados de recompensa. De esta manera se establece que “estimular la liberación de dopamina en el TS puede reforzar asociaciones estado-acción, pero no estado-resultado”. Así, se descarta que este tipo de dopamina afecte directamente al movimiento o al placer. Por el contrario, su función sería consolidar patrones de conducta repetidos, lo que permite automatizar acciones y liberar recursos cognitivos para otras tareas.
A nivel teórico, el trabajo propone un modelo de aprendizaje dual: uno basado en valores, que evalúa las consecuencias de cada acción, y otro libre de valores, que refuerza la repetición de asociaciones pasadas. Mientras que el primero permite una conducta flexible y adaptativa, el segundo consolida respuestas estables. Combinados, ambos sistemas permiten un aprendizaje más rápido y robusto. Este modelo explica por qué ciertos hábitos se mantienen incluso cuando la recompensa desaparece.
También sugiere que, en fases tempranas del aprendizaje, el sistema dopaminérgico basado en recompensa domina, pero con el tiempo el control se transfiere al sistema habitual, más eficiente para entornos predecibles. Más allá de lo explicado, los experimentos descartaron que esta señal esté relacionada con respuestas a estímulos sensoriales, amenazas o novedad. Por ejemplo, cuando se reprodujo un sonido desconocido durante la tarea, la respuesta dopaminérgica aumentó únicamente si implicaba una acción familiar no predicha por ese nuevo estímulo. Esto respaldaría la idea de que el APE mide la diferencia entre lo que se hace y lo que se espera hacer.
Implicaciones para la neurociencia del hábito
Desde una perspectiva evolutiva, este sistema ofrece ventajas claras. Automatizar respuestas ante situaciones repetidas, ahorra recursos y acelera la toma de decisiones. Como recuerda el neurocientífico Jérémie Naudé: “Los hábitos permiten actuar sin pensar. Debieron tener ventajas evolutivas, facilitando la supervivencia en entornos variables”.
El hallazgo tiene implicaciones en campos como el estudio de trastornos compulsivos, adicciones o rutinas motoras en enfermedades neurodegenerativas. También ofrece nuevas claves sobre cómo romper hábitos no deseados: no basta con modificar el valor percibido de una acción, sino que hay que interferir con las señales que refuerzan su repetición.
En conjunto, esta investigación redefine el papel de la dopamina en el aprendizaje y aporta un nuevo marco para entender cómo el cerebro consolida comportamientos automáticos. Más allá del placer, la dopamina enseña a actuar por repetición. O, como ya intuía el filósofo Alain en 1955: “El hábito: un arte de actuar sin pensarlo y mejor aún que pensarlo”.
Últimas Noticias
Ghislaine Maxwell, expareja y cómplice en la red de Jeffrey Epstein, busca salir de la cárcel en plena controversia por la publicación de los documentos del caso
Condenada a 20 años por tráfico sexual de menores y conocida por su estrecha relación con Jeffrey Epstein, Maxwell vuelve al foco judicial al preparar un nuevo recurso para intentar salir de prisión

10 frutas al horno para hacer estas Navidades
Manzanas, peras, cítricos o higos protagonizan postres sencillos que suman color, variedad y un toque saludable a la mesa navideña.

Consejos esenciales para cuidar tus neumáticos en la temporada de frío
El arranque del invierno altera las condiciones de conducción y obliga a revisar el estado de las ruedas, cuya capacidad de agarre y respuesta se ve afectada por el cambio de estación

Un hombre intenta robar un huevo Fabergé inspirado en James Bond y valorado en 18.300 euros comiéndoselo: se encuentra bajo supervisión médica y custodia policial
El colgante sustraído en Auckland destaca por su elaboración en oro de 18 quilates, esmalte verde, decenas de diamantes, zafiros y una figura de pulpo miniatura rematada con ojos de diamante negro
Tipo de cambio dólar-euro y proyecciones de este 5 de diciembre
Todos los días se ajusta el precio de las monedas de acuerdo a su valor actual


