- Née en 2022 à San Francisco comme un fournisseur de services pour l’entraînement des modèles d’IA, Together AI vient de lever 305 millions de dollars, triplant presque sa valorisation à 3,3 milliards de dollars, par rapport aux 1,25 milliard de mars 2024.
- La start-up propose une plateforme cloud optimisée, permettant aux entreprises d’accéder à plus de 200 modèles d’IA open source dans six modalités : le tchat, l’image, l’audio, la vision, le code et les plongements vectoriels (embeddings).
- En particulier, elle propose aux entreprises des versions entièrement sécurisées de DeepSeek et Llama de Meta, en se targuant de la plus grande vitesse d’inférence en production du marché, sur les GPU de Nvidia.
- Un moteur d’inférence propriétaire, basé sur FlashAttention-3 et d’autres techniques de quantification avancées, propose des performances deux à trois fois supérieures aux hyperscalers, d’après la start-up.
- Le déploiement reste pour l’instant limité : 200 MW au total. Cependant, un partenariat avec la canadienne Hypertec lui permettra de créer un cluster de 36 000 GB200 de Nividia.
- Together AI a récemment dépassé 100 millions de dollars de revenus annualisés, contre 30 millions en février 2024, et prévoit de doubler ses effectifs d’ici fin 2025.
- Le financement a été mené par General Catalyst et le saoudien Prosperity7 Ventures, avec la participation, notamment, de Nvidia, Salesforce Ventures et l’ex-CEO de Cisco John Chambers.
- À SURVEILLER : Une petite lueur de concurrence dans le cloud. L’apparition d’un moteur d’inférence offrant des performances significativement supérieures à AWS, GCS et MS Azure, ouvre la perspective que la créativité logicielle puisse rivaliser avec les économies d’échelle qui ont créé l’actuel oligopole de l’hébergement.
Together AI : un cloud pour réunir tous les modèles

La start-up californienne Together AI pivote vers un cloud spécialisé dans l’IA open source et réunit 305 millions pour ce faire.