Le Centaur qui murmurait à l’oreille des humains

Un centaure pour décrypter le cerveau humain. • Qant avec GPT-4o

Un modèle “fine-tuné” à partir de Llama 3.1 devient capable de prédire les décisions humaines dans divers contextes, grâce à un entraînement sur des données comportementales réelles.

Une équipe de chercheurs affiliés à des institutions comme l’université de Tübingen, le Max Planck Institute for Biological Cybernetics, Princeton, New York University et Google DeepMind, viennent de présenter dans la revue Nature un modèle d’intelligence artificielle capable de prédire les comportements humains dans un éventail d’expériences psychologiques. Baptisé Centaur, ce modèle repose sur l’architecture Llama 3.1 (70 milliards de paramètres) et a été spécifiquement ajusté à l’aide d’un corpus inédit, Psych-101, qui rassemble plus de 10 millions de décisions prises par 60 000 participants au sein de 160 expériences, couvrant des domaines variés comme la mémoire, la prise de décision ou l’apprentissage supervisé.

Contrairement aux modèles cognitifs traditionnels, souvent limités à des tâches spécifiques, Centaur est capable de généraliser à des contextes nouveaux. Il prédit les comportements dans des scénarios dont la structure ou la narration a été modifiée, et même dans des domaines inédits. Il reproduit non seulement les moyennes comportementales, mais aussi la diversité des trajectoires observées au sein de la population humaine, y compris dans des situations d’incertitude ou de conflit stratégique.

Un entraînement focalisé sur les réponses humaines

Pour entraîner Centaur, les chercheurs ont utilisé une technique de fine-tuning économe en paramètres, QLoRA, qui introduit de petits modules adaptatifs dans les couches du modèle Llama sans modifier ses poids principaux. Moins de 0,2 % des paramètres ont été ajustés, mais cela a suffi à transformer un modèle de langage généraliste en un simulateur de comportements humains. Le corpus d’entraînement a été converti intégralement en langage naturel, et l’apprentissage s’est concentré sur les décisions prises par des participants réels.

Lors des évaluations, Centaur surpasse systématiquement les modèles cognitifs classiques, y compris ceux issus de la théorie des perspectives ou de l’apprentissage par renforcement. Il prédit également mieux les réponses que le modèle Llama non entraîné. En simulation ouverte, où le modèle génère ses propres décisions successives, il reproduit les stratégies humaines de manière plausible, y compris dans des tâches complexes comme les jeux à deux étapes ou les tâches de bandit manchot.

Capacité de généralisation à des contextes hors distribution

Centaur a été confronté à des expériences totalement absentes de son corpus d’entraînement. Il parvient à prédire les choix humains dans des versions modifiées de tâches connues, dans des structures expérimentales inédites (comme des tâches à trois options), et même dans des contextes logiques issus du test LSAT. Dans chacun de ces cas, il offre de meilleures prédictions que les modèles cognitifs spécialisés ou le modèle Llama d’origine.

Le modèle s’est également montré capable d’anticiper les temps de réponse humains avec une précision élevée, en s’appuyant sur l’entropie prédite des réponses. Cette capacité, conforme à la loi de Hick, dépasse largement celle des autres modèles, confirmant la validité des représentations internes de Centaur pour capturer des mécanismes cognitifs sous-jacents.

Alignement avec les signaux neuronaux humains

Les chercheurs ont ensuite testé dans quelle mesure les représentations internes de Centaur s’alignent avec l’activité cérébrale mesurée par IRMf. Dans deux expériences distinctes — l’une impliquant une tâche de prise de décision, l’autre une tâche de lecture de phrases — les corrélations entre les sorties intermédiaires du modèle et les signaux cérébraux humains se sont révélées systématiquement supérieures à celles obtenues avec Llama ou avec des modèles cognitifs classiques. L’alignement est particulièrement marqué dans des régions comme le cortex préfrontal médian et le striatum ventral, impliqués dans les calculs de valeur et les erreurs de prédiction.

Un outil pour la découverte scientifique automatisée

Centaur démontre ainsi son potentiel comme instrument de découverte en psychologie computationnelle. En combinant les capacités des grands modèles de langage avec des bases de données comportementales standardisées, il devient possible de formuler, tester et ajuster des théories cognitives à grande échelle, ouvrant la voie à une psychologie assistée par l’intelligence artificielle.

En outre, les auteurs ont mis Centaur à contribution pour générer de nouvelles hypothèses scientifiques. En l’associant à un autre modèle de langage, DeepSeek-R1, ils ont pu formuler et tester une stratégie décisionnelle originale à partir des réponses humaines dans une tâche multi-attributs. La stratégie combinait deux heuristiques connues, jusque-là jamais modélisées ensemble. Elle s’est révélée mieux prédictive que les approches initiales de l’étude originale. Un affinement par minimisation du regret scientifique, en comparant les prédictions de Centaur et celles du modèle heuristique, a permis de construire un nouveau modèle aussi performant que Centaur, mais plus interprétable.

Pour en savoir plus :

L’essentiel