Mistral lanza Voxtral, la IA de voz gratuita que supera a OpenAI

ndh
By ndh
4 Min Read

Mistral ha lanzado una IA que transcribe hasta 30 minutos de audio. Conocida como Voxtral, esta familia de modelos de código abierto es capaz de comprender el audio y responder preguntas sobre él. La IA también es multilingüe, lo que significa que puede transcribir los idiomas más utilizados del mundo, incluido el español.

De acuerdo con una publicación en la web de Mistral, Voxtral es una familia de modelos de comprensión de voz. La compañía francesa asegura que su IA ofrece “precisión de última generación y comprensión semántica nativa a una fracción de lo que cuestan otros modelos”. Lo más importante, Voxtral es de código abierto, por lo que los usuarios pueden probarlo gratis desde hoy.

En términos generales, los modelos de Mistral pueden “escuchar “audio en múltiples idiomas. A diferencia de OpenAI Whisper, Voxtral incluye comprensión semántica integrada, lo que permite hacer preguntas o generar resúmenes directamente desde el audio. Los modelos cuentan con una longitud de contexto de 32k, suficiente para 30 minutos de transcripción o hasta 40 minutos de comprensión.

Mistral afirma que Voxtral supera a otros modelos de IA como Whisper large-v3, GPT-4o mini Transcribe y Gemini 2.5 Flash en todos los benchmarks en inglés. La familia de modelos consigue resultados sorprendentes en la prueba de FLEURS, que evalúa los idiomas europeos como español, italiano, alemán, francés, portugués, holandés e inglés.

Benchmarks de Voxtral, la IA de voz de Mistral
Benchmarks de Voxtral, la IA de voz de MistralBenchmarks de Voxtral, la IA de voz de Mistral

¿Qué hace Voxtral, la nueva IA de código abierto de Mistral?

Más allá de las cifras, Voxtral tiene múltiples aplicaciones. Los usuarios pueden acceder a él a través del modo de voz de Le Chat en la web o en dispositivos móviles, en donde podrán grabar audio o cargar notas de voz para transcribirlas o hacer preguntas. Voxtral está basado en Mistral Small 3.1, por lo que también cuenta con buen desempeño en la parte de texto.

Mistral señala que su familia de modelos tiene aplicaciones en sectores como la educación, salud, soporte y más.

Hombre transcribiendo notas a voz con la ayuda de un micrófonoHombre transcribiendo notas a voz con la ayuda de un micrófono

En un centro de soporte, Voxtral puede transcribir llamadas en tiempo real en varios idiomas, resumir conversaciones o detectar las intenciones de una persona y activar flujos de trabajo por voz. En un hospital, la IA puede transcribir dictados médicos de hasta 30 minutos o responder preguntas sobre un diagnóstico directamente desde las notas de voz. Mientras tanto, en una universidad, los estudiantes podrían grabar sus clases, transcribirlas y hacer un resumen automático.

La nueva IA de Mistral está disponible en dos variantes: Voxtral 24B, que se utiliza para producción a gran escala, y Voxtral Mini, que cuenta con 3.000 millones de parámetros y se aprovecha en aplicaciones locales. La compañía también ofrece una API llamada Voxtral Mini Transcribe, limitada a la transcripción.

Los modelos de Voxtral están disponibles para descargarse gratis a través de Hugging Face, y desde la app de Le Chat. Mistral confirmó que esta última se implementará en las próximas semanas para todos los usuarios.

DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://hipertextual.com/2025/07/mistral-voxtral-ia-voz-codigo-abierto-supera-openai-whisper

TAGGED:
Share This Article