Novedades OpenAI (enero 2025)
Resumen del AMA del 31 de enero de 2025 con Sam Altman, Mark Chen, Kevin Weil, Srinivas Narayanan, Michelle Pokrass y Hongyu Ren de OpenAI.
Actualizaciones y versiones del modelo
- o3-mini está disponible con capacidades de razonamiento y soporte para el uso de herramientas, incluida la funcionalidad de búsqueda web
- La fecha límite de conocimiento sigue siendo octubre de 2023, pero es menos relevante debido a las capacidades de búsqueda en Internet.
- Los modelos pequeños aún tienen un margen de mejora significativo en cuanto a herramientas, marco agéntico y compensaciones coste-rendimiento.
- Se espera que la versión completa de o3 salga en «más de unas semanas, menos de unos meses»
- Se confirma la llegada de la versión o3-pro, que sugiere que ChatGPT Pro «merecerá mucho la pena».
- GPT-5 (no se llama GPT-5o) está en desarrollo, pero no se han dado plazos.
- No se ha terminado con la serie 4o, se introducirán mejoras.
- La generación y edición de imágenes basada en GPT-4o sigue en desarrollo, llegará en «un par de meses» – «la espera merecerá la pena».
- Se reconoce que DeepSeek es un «modelo muy bueno»; OpenAI espera producir mejores modelos pero con menos ventaja que en años anteriores.
Características y capacidades
- Operator llegará al plan Plus en «meses»
- El uso de ordenadores se considera crucial para la inteligencia artificial a largo plazo.
- Muy pronto habrá más agentes.
- Próxima presentación de una versión más detallada de las fichas de pensamiento («thinking tokens«).
- Las capacidades de razonamiento siguen siendo «la parte más crítica» del desarrollo.
- Próximas actualizaciones del modo de voz avanzado, con planes para integrarlo con interacciones de texto y lienzo.
- Se prevé que los modelos de razonamiento admitan PDF y archivos adjuntos.
- Las funciones de visión llegarán a o3-mini (actualmente disponibles en o1).
- Se está trabajando en el aumento de la longitud de los contextos, aunque no hay plazos concretos.
- Se está desarrollando la integración de la función de memoria con los modelos de la serie o.
- Se está trabajando en la unificación de todas las herramientas y modalidades en los modelos de razonamiento.
Acceso y precios
- El equipo está estudiando cómo mostrar los mensajes restantes sin que los usuarios sean demasiado conscientes de los límites (actualmente no hay barra de progreso/contador para evitar «efectos de escasez»)
- Se está trabajando para que la API de los asistentes sea «mucho más fácil de usar».
- Se desea reducir el precio del nivel Plus con el tiempo, pero no hay planes para aumentarlo.
- Los usuarios Plus obtienen 150 mensajes por día con o3-mini y 50 mensajes por semana con o3-mini-high.
- Los usuarios Pro tienen acceso ilimitado a o3-mini-high.
- Prueba de la oferta de residencia de datos de la UE en la API para el cumplimiento de GDPR.
Foco de desarrollo futuro y principales prioridades
- Mejora del rendimiento de las llamadas a funciones de varios pasos.
- Capacidades de contexto largo.
- Unificación de la funcionalidad con o-series.
- Aplicaciones «más agénticas» que puedan gestionar tareas complejas y de larga duración.
Robótica
- Objetivo inicial: «hacer una pequeña tirada de un robot realmente bueno y aprender de ahí».
- Centrarse en aprender de los despliegues iniciales.
- La visión a largo plazo incluye robots que realicen tareas útiles en el mundo real.
Investigación y código abierto
- Debate sobre la posible publicación de modelos de peso e investigación.
- Debate interno sobre la estrategia de código abierto; Sam considera que el enfoque actual es «el lado equivocado de la historia».
- Modelos de código abierto anteriores, como GPT-2 y Jukebox, y se está estudiando la posibilidad de publicar más.
Perspectivas de AGI
- El escenario de despegue rápido se considera «más plausible que… hace un par de años»
- Se espera que su principal impacto sea la aceleración de los descubrimientos científicos
- La visión de la interacción en el futuro incluye una IA más ágil que trabaje continuamente en segundo plano.
- Las principales áreas de interés para los avances de la AGI serían la curación de enfermedades y el desarrollo de energía más barata.
Infraestructura
- El proyecto Stargate se describe como «muy importante» para el futuro de OpenAI.
- Descrito como una fábrica para «convertir la energía y las GPU en cosas increíbles».
- Crítico para escalar modelos en dos dimensiones: pre-entrenamientos más grandes y más RL/strawberry.
Información basada en la publicación de Reddit: «AMA with OpenAI’s Sam Altman, Mark Chen, Kevin Weil, Srinivas Narayanan, Michelle Pokrass, and Hongyu Ren«