Kyutai Labs lanza Moshi que tiene lo que OpenAI prometió

Kyutai Labs lanza Moshi que tiene lo que OpenAI prometió

Kyutai Labs lanza Moshi que hace realidad lo que OpenAI lleva posponiendo desde la demo de OpenAI con GPT-4o.

Duro golpe para OpenAI: Mientras ellos atrasan el modo avanzado de voz Kyutai Labs acaba de lanzar Moshi, un modelo básico multimodal nativo en tiempo real que puede escuchar y hablar, crear sonidos, imitar emociones,… similar a lo que OpenAI demostró con GPT-4o en mayo.

¿Qué tiene Moshi?

  • 🗣️ Habla y escucha en tiempo real con una latencia bajísima (160-240 ms)
  • 🎭 Entiende y expresa emociones (¡hasta puede imitar acentos!)
  • 💡 ‘Piensa’ mientras habla, generando pensamientos en texto
  • 🎧 Puede escuchar y hablar a la vez (¡como un humano de verdad!)
  • 🧠 Usa un LLM de 7B parámetros llamado Helium
  • 💻 Funciona hasta en un portátil normalito

Lo mejor de todo:

  • ¡Será de código abierto! Modelos, paper y código a la vista de todos 🌐
  • Desarrollado en 6 meses por solo 8 investigadores🥊.

Moshi

  • Moshi es una IA conversacional experimental.
  • Tómate todo lo que dice con cautela.
  • Las conversaciones están limitadas a 5 minutos.
  • Moshi piensa y habla al mismo tiempo.
  • Moshi puede escuchar y hablar en todo momento: cnoexión máxima entre Moshi y tú.
  • Pídele que haga algún juego de rol de piratas, cómo hacer lasaña o qué película ha visto por última vez.
  • Nos esforzamos por soportar todos los navegadores, pero en Chrome funciona mejor.
  • Horneado con <3 Kyutai Open Science AI Lab.

Ejemplo de Moshi en acción

No obstante, muchas veces hablar con la nueva IA conversacional en tiempo real de Moshi, es como hablar con alguien que se ha metido un tripi 😂.

Ramón hablando con Moshi
Configuración servidor MOSHI
Configuración servidor mientras Ramón hablaba con Moshi

¿Quieres saber más sobre la inteligencia artificial generativa? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Moshi se puede probar aquí.

Publicaciones Similares

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.