Todas las novedades del OpenAI dev day 2023
Ayer tuvo lugar el OpenAI DevDay 2023 en San Francisco, presentado por Sam Altman, CEO de OpenAI. Y para que no tengas que tragarte el streaming de una hora, te dejo un resumen de lo que se ha presentado hoy por parte de OpenAi.
GPT 4-Turbo
GPT-4 Turbo es más rápido, preciso y barato que su predecesor, GPT-4. El nuevo modelo tiene un registro de los acontecimientos mundiales hasta abril de 2023, lo que representa un salto considerable en rendimiento y precisión.
Admite una ventana de contexto de 128K, equivalente a 300 páginas de texto en un solo prompt. GPT-4 Turbo también incluye mejoras en las llamadas a funciones y se desempeña mejor en tareas que requieren un seguimiento cuidadoso de instrucciones.
Cambios más significativos:
- GPT 4-Turbo ya está disponible a través de la API para los usuarios de ChatGPT Plus.
- Contexto de token de 128k (frente a los 32k anteriores).
- Más de un 50% más barato que GPT-4.
- Límite de conocimiento en abril de 2023 (frente a septiembre de 2021).
- Rendimiento mejorado con respecto a GPT-4.
- Ahora puedes proporcionar imágenes junto a tu prompt de texto a través de la API.
- Un nuevo modo JSON que obliga a GPT a responder en JSON puro.
- Limitación de velocidad más «generosa».
GPT personalizados mediante una interfaz intuitiva
GPT hace referencia a la tecnología Generative Pre-trained Transformer (GPT) y ahora los usuarios van a poder crear sus propios «GPT personalizados» especializados para tareas específicas.
- Low Code: Puedes crear CustomGPTs sin escribir código. Utiliza lenguaje natural y carga archivos para el contexto.
- Personalizados para tu empresa: Se pueden crear GPT personalizados específicos para tu compañía u organización.
- Dos ejemplos que ya se pueden usar: OpenAI nos ofrece dos GPT personalizados para empezar: Canva y ZapierAI.
Tienda de GPT personalizados
Los usuarios pueden subir sus GPT personalizados a la tienda para que otros las utilicen.
- OpenAI proporcionará un programa de reparto de ingresos, donde los autores de modelos populares recibirán $.
API de asistentes
La API de asistentes te permite construir agentes autónomos que tienen acceso a herramientas.
- OpenAI actualmente proporciona 3 herramientas para empezar:
- Intérprete de código (codificación),
- Recuperación (conocimiento personalizado), y
- Llamada a funciones.
- Al igual que con la API normal, se especifica su función a través de una instrucción personalizada.
Habla de calidad humana
- Open AI ha lanzado los modelos tts-1 y tts-1-hd.
- El modelo tts-1 está optimizado para la velocidad, y el modelo tts-1-hd para la calidad.
- Elije entre 1 de los 6 tipos de voz y crea un habla humana con sonido realista desde una API.
Protección ante demandas de derechos de autor
Te protege a ti y a tu empresa de reclamaciones por derechos de autor al utilizar los productos de OpenAI.
Whisper V3
Whisper es el modelo de conversión de voz a texto de OpenAI. Transcribe la voz y genera texto.
- Whisper es de código abierto, y la V3 también se ha publicado como código abierto.
- Whisper v3 ahora mismo aún no está disponible a través de la API de pago pero tardará poco en estarlo.
Modelos personalizados para empresas
Para empresas seleccionadas, el equipo de investigación de OpenAI creará un modelo personalizado para su empresa con conocimientos específicos del dominio.
¿Qué nos espera?
- Las agencias crearán activos de marketing de 100 páginas en 3 minutos. La gente creará y venderá libros en 3 horas.
- Todo ello gracias a una ventana contextual de 128k.
- Aplicacines de yoga que corrigen tus posturas. Apps turísticas que te dan información sobre lo que capta la cámara de tu dispostivio.
- Todo ello gracias a GPT-Vision.
- Cientos de miles de GPT personalizados.
- Es la tecnología con la que soñábamos y que nos va a permitir construir cosas chulas.
¿Quieres ver el vídeo de la presentación?
Aquí lo tienes (en inglés):
Con esto está todo dicho. ¡Al lío!