- Démissions. Confrontés à une polémique croissante sur les dérives de Grok, le chatbot de X, la directrice générale du réseau social Linda Yaccarino et le directeur scientifique de xAI, Igor Babuschkin ont présenté leur démission hier, peu avant qu’Elon Musk ne présente le nouveau Grok 4.
- Petit nouveau. Selon Elon Musk – sans qu’aucune preuve technique indépendante ne vienne appuyer l’affirmation –, Grok 4 est conçu pour générer des réponses basées sur des principes fondamentaux plutôt que sur la reconnaissance de motifs issus des données d'entraînement, par proximité vectorielle. Cela résulterait, le cas échéant, en des explications plus robustes et originales, particulièrement pour les sujets techniques, une plus grande cohérence logique et des capacités analytiques plus approfondies.
- Grok codeur. Une variante spécialisée, Grok 4 Code, s’intègre à des environnements de développement et des éditeurs IA, comme Cursor. Un éditeur natif s’inspirera de Visual Studio pour permettre un "codage agentique" plus autonome, où l'IA peut écrire, modifier et déboguer du code directement sans que les développeurs ne quittent l'interface Grok, sur l’offre Grok4Heavy (ou l’API avec exécution de fonctions).
- Grok contexte. Le modèle dispose d'une fenêtre d’attention de 256 000 tokens, permettant des conversations étendues et une analyse approfondie de documents ou de bibliothèques de code. Grok4 se hisse ainsi au-dessus de ses principaux rivaux : Claude 4 et o3 n’offre que 200 000 jetons de contexte. Personne n’égale, toutefois, Gemini 2.5 Pro et Flash, avec 1 million de tokens.
- Grok scores. Le modèle Heavy, doté d’outils, aurait obtenu 45% au benchmark difficile "Humanity's Last Exam" (HLE) – plus du double du précédent meilleur score, de Gemini 2.5 Pro – ; 95 % sur AIME 2025 (mathématiques avancées) ; 73% sur SWE-Bench (codage) et 89% sur GPQA (raisonnement niveau licence).
- Vision tardive. Grok 4 est présenté comme multimodal, pouvant accepter plusieurs types d'entrée, incluant le texte et les images, avec des fonctionnalités de génération d'images et de traitement visuel. Mais seul le texte est pour l’instant disponible à tous ; la vision est limitée à l’API.
- EN FILIGRANE : MechaHitler, malvenu en Pologne et rejeté en Turquie. xAI a supprimé hier des contenus publiés par son chatbot Grok après que celui-ci ait fait l’éloge d’Adolf Hitler en réponse à des questions orientées, et qu’il se soit attribué lui-même le surnom “MechaHitler”. Presque simultanément, le ministre polonais du Numérique, Krzysztof Gawkowski, a déclaré publiquement qu’il était prêt à interdire X si les injures que le chatbot profère régulièrement envers des politiciens modérés, comme le Premier ministre Donald Tusk, s’avéraient enfreindre la loi. Plus expéditive, la Turquie a bloqué hier l’accès au chatbot, dans l’attente des résultats d’une enquête sur des insultes proférées en direction de Mahomet, le fondateur de la république Mustafa Kemal Ataturk et son président actuel, Recep Tayip Erdogan.
Grok reprend les dérapages d’Elon Musk • Une caricature de Qant avec o3 et GPT4o
- À SURVEILLER : Un problème de crédibilité. Pour réduire les dérives, Musk affirme avoir fait diminuer la sensibilité de Grok aux prompts qu’il reçoit sur le réseau social. Il veut également “diminuer la dépendance aux médias mainstream”, en entraînant Grok 4 pour qu’il évite de s'appuyer sur des affirmations non vérifiées et reste sceptique face aux biais médiatiques. Il souhaite même "réécrire l'ensemble du corpus de connaissances humaines" pour éliminer les biais et améliorer la précision factuelle. En attendant, malgré la conception de la “liberté d’expression” affichée par son chef, xAI a annoncé avoir renforcé les filtres qui empêchent Grok de donner des réponses haineuses. Précisément ce que font OpenAI, Google et Anthropic.