Volver al blog
Noticias de IA

La aparicion del modelo de IA propio de Microsoft MAI

Vista previa del modelo de IA propio de Microsoft

2025.09.02
La aparicion del modelo de IA propio de Microsoft MAI

Tema de IA: Vista previa del modelo de IA propio de Microsoft

La aparicion del modelo de IA propio de Microsoft MAI
Un usuario trabajando en un portatil mirando una pantalla que presenta los modelos MAI-Voice-1 y MAI-1-preview
Foto original citada, Fuente de imagen: GPT-5

Microsoft AI ha presentado MAI-Voice-1, un sistema que expresa emociones a traves de la voz, y MAI-1-preview, un modelo masivo entrenado con 15,000 GPUs.

MAI-Voice-1 para voz emocionalmente expresiva y MAI-1-preview para procesamiento inteligente de texto se presentan por primera vez en Copilot.

Nuevos modelos internos de Microsoft AI

  • Microsoft AI (MAI) ha lanzado dos modelos internos.
  • MAI-Voice-1 para generacion de voz natural y MAI-1-preview, el primer modelo base desarrollado internamente.
  • MAI-Voice-1 ofrece audio de alta calidad y emocionalmente expresivo a una velocidad impresionante, generando 1 minuto de audio en menos de 1 segundo con una sola GPU.
  • El modelo de voz ya se esta utilizando en Copilot Daily y Podcasts, y se puede probar en Copilot Labs.
  • MAI-1-preview, un modelo base de mezcla de expertos, fue entrenado con aproximadamente 15,000 GPUs NVIDIA H100 y actualmente esta en pruebas publicas en LMArena.
  • El modelo base se desplegara gradualmente en las funciones de texto de Copilot, con acceso API para probadores de confianza.

El objetivo de Microsoft AI: IA para todos

Microsoft AI (MAI) tiene como objetivo crear IA que ayude a cada individuo y organizacion a alcanzar su maximo potencial.

Microsoft ve la IA como un companero util y confiable -- una puerta al conocimiento y una gama de capacidades adaptadas a las necesidades especificas de las personas.

Para realizar esta vision, MAI ha estado construyendo modelos disenados a proposito a traves de equipos e instalaciones de clase mundial.

Esta semana marca la primera vista previa de dos sistemas internos construidos para avanzar en ese objetivo.

MAI-Voice-1: Generacion de voz emocionalmente expresiva de alta velocidad

El primer lanzamiento es MAI-Voice-1, un modelo de generacion de voz disenado para crear audio natural, emocionalmente expresivo y de alta calidad para escenarios de uno o multiples hablantes.

Rendimiento: MAI-Voice-1 puede generar 1 minuto de audio en menos de 1 segundo con una sola GPU, convirtiendolo en uno de los sistemas de voz mas eficientes disponibles actualmente.

Uso: Ya esta integrado en Copilot Daily y Podcasts, proporcionando audio mas natural para estas funciones.

Experiencia: El modelo tambien esta disponible en Copilot Labs, donde los usuarios pueden probar demos como narracion de historias y meditacion guiada creadas con entradas simples.

MAI-Voice-1 hace la voz mas rapida y emocionalmente expresiva, posicionando la voz como una interfaz principal para los companeros de IA del futuro.

MAI-1-Preview: Un modelo base entrenado con 15,000 GPUs

El segundo logro importante es MAI-1-preview, el primer modelo base entrenado completamente internamente de principio a fin.

Este modelo sigue una arquitectura de mezcla de expertos y paso por pre-entrenamiento y post-entrenamiento en aproximadamente 15,000 GPUs NVIDIA H100.

Evaluacion: El modelo esta en pruebas publicas en LMArena, una plataforma comunitaria para evaluacion de modelos.

Casos de uso: Construido para seguir instrucciones y manejar respuestas cotidianas utiles, se aplicara a funciones de texto selectas de Copilot en las proximas semanas.

Acceso: Ademas de LMArena, los probadores de confianza pueden acceder al modelo a traves de pruebas API, permitiendo a Microsoft AI recopilar retroalimentacion dirigida.

Se puede solicitar acceso aqui.

Esto marca el inicio de la estrategia de MAI para entregar modelos base internos mejorados mientras aprovecha nuevos enfoques de modelos asociados y de codigo abierto para asegurar los mejores resultados en todos los productos.

Planes futuros: Modelos especializados para diversos casos de uso

Microsoft AI enfatiza que estos dos modelos son solo el primer paso de una estrategia mas amplia.

Mas alla de los sistemas base, Microsoft planea crear una variedad de modelos especializados adaptados a intenciones y contextos especificos del usuario.

Este enfoque esta disenado para entregar mayor valor a los clientes y asegurar que Copilot y otros productos de Microsoft puedan adaptarse a los millones de interacciones diversas que facilitan cada dia.

Preguntas y Respuestas

P: Que modelos ha lanzado Microsoft AI?

R: Microsoft AI (MAI) ha anunciado MAI-Voice-1, un modelo de generacion de voz emocionalmente expresiva, y MAI-1-preview, su primer modelo base.

P: Que hace especial a MAI-Voice-1?

R: MAI-Voice-1 genera audio natural de alta calidad a velocidad impresionante, produciendo 1 minuto de voz en menos de 1 segundo con una sola GPU.

P: Donde se puede usar MAI-Voice-1?

R: Ya esta integrado en Copilot Daily y Podcasts, y se puede probar a traves de Copilot Labs que muestra demos de narracion y guia de meditacion.

P: Como fue entrenado MAI-1-preview?

R: MAI-1-preview es un modelo base de mezcla de expertos entrenado con aproximadamente 15,000 GPUs NVIDIA H100, disenado para seguir instrucciones y proporcionar respuestas utiles.

P: Como pueden los desarrolladores probar MAI-1-preview?

R: Esta disponible publicamente en LMArena para evaluacion abierta, con acceso adicional disponible a traves de pruebas API para usuarios de confianza.

Implicaciones

El lanzamiento de MAI-Voice-1 y MAI-1-preview demuestra el esfuerzo de Microsoft AI por construir sus propios modelos centrales mientras aprovecha nuevos enfoques de asociaciones y codigo abierto.

Muchos observadores ven esto como Microsoft dando un paso hacia una mayor independencia de los productos de OpenAI mientras invierte en desarrollar sus propios sistemas a gran escala para el futuro.

Para los usuarios, esto significa interacciones mas emocionalmente expresivas y similares a las humanas a traves de la voz, y acceso a modelos mas capaces y receptivos para uso basado en texto en Copilot.

Para la industria, muestra la estrategia de Microsoft de combinar modelos base de proposito general con sistemas especializados para satisfacer diversas necesidades de los usuarios.

Sobre todo, Microsoft AI esta avanzando hacia una vision a largo plazo donde la voz se convierte en una interfaz central para los companeros de IA y los modelos base se convierten en la columna vertebral de una IA confiable y practica.

Estos primeros lanzamientos internos marcan el comienzo de un portafolio mas amplio disenado para entregar IA estable e independiente para la vida cotidiana.

Fuente: Alicia Shapiro, AiNews, "Microsoft AI Introduces MAI-Voice-1 and MAI-1-Preview Foundation Model", https://www.ainews.com/p/microsoft-ai-introduces-mai-voice-1-and-mai-1-preview-foundation-model, (2025-08-29)

Le interesa la automatizacion con IA?

Encuentre la solucion adecuada para su negocio a traves de una consulta gratuita.

Solicitar consulta gratuita