OpenAI acaba de lanzar Voice Engine

Inteligencia Artificial

OpenAI acaba de lanzar Voice Engine

Ramón Rautenstrauch Actualizado a7/abril/2024

OpenAI acaba de lanzar la siguiente locura total: Voice Engine.

Voice Engine utiliza una muestra de audio de 15 segundos para convertir texto en lenguaje natural que es indistinguible de la muestra proporcionada. Solo hay que escuchar esto:

Juzga tu mismo si puedes distinguir el el audio de referencia y el generado.

Construir motores de voz con seguridad

En OpenAI son conscientes de que generar un discurso que se asemeje a la voz de las personas entraña graves riesgos, que son especialmente importantes en un año de elecciones. Están trabajando con socios estadounidenses e internacionales de la Administración, los medios de comunicación, el mundo del espectáculo, la educación, la sociedad civil y otros ámbitos para asegurar que incorporan sus comentarios a medida que avanzan.

Los que prueban hoy Voice Engine han aceptado sus políticas de uso, que prohíben suplantar la identidad de otra persona u organización sin consentimiento o derecho legal. Además, exigen el consentimiento explícito e informado del hablante original y no se permite que los desarrolladores creen formas de que los usuarios individuales creen sus propias voces. También se debe informar claramente a la audiencia de que las voces que escuchan son generadas por IA. Por último, se han implantado una serie de medidas de seguridad, como la marca de agua para rastrear el origen de cualquier audio generado por Voice Engine, así como la supervisión proactiva de su uso.

OpenAI cree que cualquier despliegue generalizado de tecnología de voz sintética debe ir acompañado de experiencias de autenticación de voz que verifiquen que el hablante original está añadiendo su voz al servicio con conocimiento de causa, y de una lista de voces prohibidas que detecte e impida la creación de voces demasiado parecidas a personajes destacados.

De cara al futuro

Voice Engine es una continuación del compromiso de OpenAI de comprender la frontera técnica y compartir abiertamente lo que está siendo posible con la IA. En consonancia con su enfoque de la seguridad de la IA y sus compromisos voluntarios, se ha optado por previsualizar esta tecnología, pero no por difundirla ampliamente en este momento. OpenAI espera que este avance de Voice Engine subraye su potencial y motive la necesidad de reforzar la resistencia de la sociedad frente a los retos que plantean modelos generativos cada vez más convincentes. En concreto, animan a tomar medidas como:

Eliminar progresivamente la autenticación basada en la voz como medida de seguridad para acceder a cuentas bancarias y otra información sensible.
Explorar políticas para proteger el uso de la voz de las personas en la IA.
Educar al público para que comprenda las capacidades y limitaciones de las tecnologías de IA, incluida la posibilidad de contenidos de IA engañosos.
Acelerar el desarrollo y la adopción de técnicas para rastrear el origen de los contenidos audiovisuales, de modo que siempre quede claro cuándo se está interactuando con una persona real o con una IA.

Es importante que la gente de todo el mundo entienda hacia dónde se dirige esta tecnología, tanto si al final la despliega ampliamente OpenAI como si no.

¿Quieres saber más sobre la inteligencia artificial generativa? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Información basada en «Navigating the Challenges and Opportunities of Synthetic Voices» publicado en el blog de OpenAI.

Ramón Rautenstrauch

Conecta conmigo en LinkedIN
Apasionado ❤️ del Marketing. Microsoft MVP 😊. Evangelista Copilot 🤖. CMO 😍. SEO 🧠. Consultor IA y Dynamics 365 👨‍💻. Facilitador PLAYMOBILpro 💭.
Acerca de Ramón Rautenstrauch, autor de Consultor365.com

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.