Mistral souffle sur des images

"Un robot dans le vent" (Qant, M. de R. avec Midjourney)

Mistral vient de lancer un modèle multimodal, Pixtral 12B, le premier de la start-up française. 

La startup française Mistral a lancé Pixtral 12B, son premier modèle multimodal capable de traiter des images et du texte.

Le modèle, de 12 milliards de paramètres, d'une taille de 24 Go, peut répondre à des questions sur des images de toute taille, via des URL ou des images encodées en base64.

Disponible sur GitHub et Hugging Face sous licence Apache 2.0, Pixtral 12B peut être téléchargé et ajusté sans restrictions.

À SURVEILLER. Le lancement prochain de Pixtral 12B sur les plateformes de Mistral Le Chat et La Plateforme.

L’essentiel