Resumen del AMA de Reddit con OpenAI (31/enero/2025)

Resumen del AMA del 31 de enero de 2025 con Sam Altman, Mark Chen, Kevin Weil, Srinivas Narayanan, Michelle Pokrass y Hongyu Ren de OpenAI.

Contenidos mostrar

Actualizaciones y versiones del modelo

o3-mini está disponible con capacidades de razonamiento y soporte para el uso de herramientas, incluida la funcionalidad de búsqueda web
La fecha límite de conocimiento sigue siendo octubre de 2023, pero es menos relevante debido a las capacidades de búsqueda en Internet.
Los modelos pequeños aún tienen un margen de mejora significativo en cuanto a herramientas, marco agéntico y compensaciones coste-rendimiento.
Se espera que la versión completa de o3 salga en «más de unas semanas, menos de unos meses»
Se confirma la llegada de la versión o3-pro, que sugiere que ChatGPT Pro «merecerá mucho la pena».
GPT-5 (no se llama GPT-5o) está en desarrollo, pero no se han dado plazos.
No se ha terminado con la serie 4o, se introducirán mejoras.
La generación y edición de imágenes basada en GPT-4o sigue en desarrollo, llegará en «un par de meses» – «la espera merecerá la pena».
Se reconoce que DeepSeek es un «modelo muy bueno»; OpenAI espera producir mejores modelos pero con menos ventaja que en años anteriores.

Operator llegará al plan Plus en «meses»
El uso de ordenadores se considera crucial para la inteligencia artificial a largo plazo.
Muy pronto habrá más agentes.
Próxima presentación de una versión más detallada de las fichas de pensamiento («thinking tokens«).
Las capacidades de razonamiento siguen siendo «la parte más crítica» del desarrollo.
Próximas actualizaciones del modo de voz avanzado, con planes para integrarlo con interacciones de texto y lienzo.
Se prevé que los modelos de razonamiento admitan PDF y archivos adjuntos.
Las funciones de visión llegarán a o3-mini (actualmente disponibles en o1).
Se está trabajando en el aumento de la longitud de los contextos, aunque no hay plazos concretos.
Se está desarrollando la integración de la función de memoria con los modelos de la serie o.
Se está trabajando en la unificación de todas las herramientas y modalidades en los modelos de razonamiento.

El equipo está estudiando cómo mostrar los mensajes restantes sin que los usuarios sean demasiado conscientes de los límites (actualmente no hay barra de progreso/contador para evitar «efectos de escasez»)
Se está trabajando para que la API de los asistentes sea «mucho más fácil de usar».
Se desea reducir el precio del nivel Plus con el tiempo, pero no hay planes para aumentarlo.
Los usuarios Plus obtienen 150 mensajes por día con o3-mini y 50 mensajes por semana con o3-mini-high.
Los usuarios Pro tienen acceso ilimitado a o3-mini-high.
Prueba de la oferta de residencia de datos de la UE en la API para el cumplimiento de GDPR.

Mejora del rendimiento de las llamadas a funciones de varios pasos.
Capacidades de contexto largo.
Unificación de la funcionalidad con o-series.
Aplicaciones «más agénticas» que puedan gestionar tareas complejas y de larga duración.

Objetivo inicial: «hacer una pequeña tirada de un robot realmente bueno y aprender de ahí».
Centrarse en aprender de los despliegues iniciales.
La visión a largo plazo incluye robots que realicen tareas útiles en el mundo real.

Debate sobre la posible publicación de modelos de peso e investigación.
Debate interno sobre la estrategia de código abierto; Sam considera que el enfoque actual es «el lado equivocado de la historia».
Modelos de código abierto anteriores, como GPT-2 y Jukebox, y se está estudiando la posibilidad de publicar más.

El escenario de despegue rápido se considera «más plausible que… hace un par de años»
Se espera que su principal impacto sea la aceleración de los descubrimientos científicos
La visión de la interacción en el futuro incluye una IA más ágil que trabaje continuamente en segundo plano.
Las principales áreas de interés para los avances de la AGI serían la curación de enfermedades y el desarrollo de energía más barata.

El proyecto Stargate se describe como «muy importante» para el futuro de OpenAI.
Descrito como una fábrica para «convertir la energía y las GPU en cosas increíbles».
Crítico para escalar modelos en dos dimensiones: pre-entrenamientos más grandes y más RL/strawberry.

¿Quieres saber más sobre las soluciones de inteligencia artificial generativa de Microsoft? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?