Le 21 mai, Anthropic a dévoilé Claude 4 Opus, présenté comme son modèle « le plus intelligent à ce jour ». L’entreprise, fondée par d’anciens membres d’OpenAI, positionne Opus comme une réponse directe aux derniers modèles de Google et OpenAI. Disponible via l’interface Claude.ai et par API, Opus s’adresse aux usages avancés en entreprise et à la recherche. Il est accompagné de deux déclinaisons : Sonnet 4, plus rapide et économique, et Haiku 4, optimisé pour les interactions en temps réel.
Raisonnement complexe et mémoire étendue
Claude 4 Opus se distingue par ses capacités en raisonnement logique, codage avancé et compréhension de documents longs. Il obtient des résultats remarquables sur les principaux benchmarks académiques, avec des scores très élevés sur MMLU (connaissances générales), GPQA (logique), GSM8k (arithmétique) et HumanEval (programmation). Sur ce dernier, Claude Opus atteint environ 87 %, ce qui en fait l’un des meilleurs modèles actuellement disponibles.
L’un de ses points de force est sa fenêtre contextuelle étendue à 200 000 tokens, soit l’équivalent de plus de 500 pages de texte. Cela lui permet d’analyser en une seule requête des ensembles de documents volumineux. Anthropic affirme que le modèle peut retrouver une information précise dans un corpus d’un million de tokens avec une fiabilité supérieure à 99 %.
Performances différenciées selon les variantes
Claude 4 est proposé en trois versions aux performances et usages distincts. Haiku 4, le plus léger, est conçu pour répondre quasi instantanément à des requêtes simples. Il est utilisé par défaut dans l’application mobile Claude. Sonnet 4, intégré gratuitement à Claude.ai, offre un bon compromis entre vitesse et qualité. Opus 4, quant à lui, nécessite un abonnement Claude Pro (20 $ par mois) et s’active automatiquement dans les requêtes complexes.
Anthropic ne publie pas le nombre exact de paramètres, mais les tests indépendants montrent une différence sensible en qualité de réponse entre les trois versions, en particulier sur les tâches longues ou les questions à plusieurs étapes.
Codage assisté et usages professionnels
Claude 4 Opus est particulièrement performant en développement logiciel. Anthropic a lancé Claude Code, un agent conçu pour interagir avec des environnements comme VS Code ou en ligne de commande. Lors de tests menés par Rakuten, Opus a pu générer du code en continu pendant plus de sept heures, sans perte de cohérence. Le modèle peut analyser des projets entiers, proposer des correctifs, générer des tests et documenter automatiquement ses changements.
Les cas d’usage incluent aussi la synthèse de réunions, l’analyse de corpus documentaires, ou la recherche d’information métier. Des entreprises comme Slack, Notion ou Quora utilisent les modèles Claude pour automatiser des tâches rédactionnelles ou organiser des flux de données internes.
Limites connues et accès
Claude 4 Opus conserve des limitations. Il n’est pas multimodal : il peut lire des images statiques mais ne traite ni l’audio ni la vidéo. Il peut encore produire des erreurs factuelles, malgré une réduction significative des hallucinations. Et son coût d’usage est élevé.
Le modèle est disponible via Claude.ai (Opus activé pour les abonnés Pro), par API sur Amazon Bedrock et Google Vertex AI, et intégré à plusieurs produits tiers. Anthropic propose aussi un accès API payant, avec des tarifs différenciés selon le modèle (Haiku, Sonnet ou Opus).
Peu après la sortie du modèle, le chercheur indépendant Simon Willison a publié une analyse détaillée des system prompts utilisés par Anthropic dans ses modèles Claude 4 (Opus et Sonnet), révélant comment l’entreprise encadre leur comportement via des instructions internes souvent non publiées. Ces prompts définissent notamment des règles pour éviter les flatteries excessives, les comportements dangereux ou les violations de droits d’auteur. Willison a identifié des directives précises sur l’usage des citations, l’interdiction de reproduire des paroles de chansons, et la limitation des listes non sollicitées.
Pour en savoir plus :
- Anthropic (post)
- Anthropic : Fiche technique
- Simon Willison (system prompt)