« Réinventez demain avec l’IA »

Voxtral : Mistral AI se lance dans l'arène des modèles de langage vocal à code source ouvert.

Samedi 19 Juillet 2025

Mardi dernier, Mistral AI a rendu public Voxtral, sa toute première gamme de modèles audio en open source. Pensés pour un usage professionnel, ces modèles de compréhension de la parole marquent l'arrivée de la startup française sur le secteur stratégique de l'intelligence vocale, un domaine où des acteurs tels qu'OpenAI, Meta et Google dominent jusqu'à présent.

La gamme Voxtral se compose de deux modèles majeurs : Voxtral Small (24 milliards de paramètres) et Voxtral Mini (3 milliards de paramètres), chacun étant destiné à des environnements différents. Le modèle Small est conçu pour des applications complexes et un déploiement cloud à grande échelle, tandis que la version Mini est orientée vers des déploiements embarqués ou à ressources limitées. Mistral AI propose également Voxtral Mini Transcribe, une version spécialement optimisée pour la transcription vocale, avec un rapport qualité/prix supérieur à celui de modèles comme Whisper.

Voxtral : Mistral AI se lance dans l\'arène des modèles de langage vocal à code source ouvert.

Des fonctionnalités qui vont au-delà de la simple transcription

Voxtral ambitionne d'être une alternative aux systèmes ASR (reconnaissance automatique de la parole) peu fiables et aux API fermées et propriétaires, souvent onéreuses.

Conçu pour gérer de longs extraits audio, il peut traiter jusqu'à 30 minutes de transcription ou 40 minutes de compréhension, grâce à une fenêtre contextuelle de 32 000 tokens.

Reposant sur l'architecture du modèle linguistique Mistral Small 3.1, il est capable de répondre à des requêtes formulées oralement, de produire des résumés à partir de fichiers audio ou de convertir une intention exprimée à l'oral en appel API ou en flux backend. Le modèle prend en charge les langues les plus répandues, telles que l'anglais, l'espagnol, l'arabe, le français, le portugais, l'hindi, l'allemand, le néerlandais et l'italien.

Des performances de premier plan

Selon les premières évaluations communiquées par Mistral, Voxtral Small surpasse le modèle de référence Whisper v3, mais également Gemini 2.5 Flash et GPT-4o Mini Transcribe d'Open AI, sur plusieurs indicateurs de performance de transcription automatique, tout en maintenant une consommation de ressources optimisée.

Dans FLEURS (ci-dessous), Voxtral Small affiche des performances de pointe dans toutes les langues testées, avec une justesse supérieure à Whisper.

© Mistral AI

Pour les tâches de traduction vocale, Voxtral Small rivalise avec GPT-4o Mini et Gemini.

Disponibilité

Les deux modèles, distribués sous licence Apache 2.0, sont téléchargeables sur Hugging Face. Voxtral est également accessible via API à partir de 0,001 $/minute pour ceux qui souhaitent l'intégrer à leur application, soit moins de la moitié du coût des offres concurrentes, et enrichira prochainement l'assistant conversationnel de Mistral AI, Le Chat.

Pour les besoins métiers spécifiques, les entreprises ont la possibilité d'opter pour des déploiements privés et sécurisés, notamment dans les secteurs juridiques ou médicaux.

Mistral AI prévoit d'ajouter dans les mois à venir de nouvelles fonctionnalités, telles que la segmentation audio, la diarisation (identification des différents locuteurs) ou la détection des émotions.

Une dynamique de marché en pleine expansion

Ce lancement a lieu à un moment où les solutions de transcription et d'analyse audio sont très demandées, avec une intensification des cas d'usage dans le support client, l'analyse d'interactions, la documentation automatisée ou l'assistance vocale. Voxtral vient se positionner dans un domaine déjà occupé par des initiatives comme Whisper (OpenAI, MIT), SeamlessM4T (Meta, non commercial), ou des frameworks comme NVIDIA NeMo ou ESPnet.

Cependant, rares sont ceux qui proposent, à ce jour, un accès libre, une compréhension sémantique intégrée et la capacité de déclencher des actions à partir de la voix, au sein d'une solution unique.

Cet article publirédactionnel est publié dans le cadre d'une collaboration commerciale

Ils nous font confiance

mabougiebio.com
thea-france.com
diyshirt.fr
www.rodentia.fr
naturel.net
www.faubourg54.com