Meta anuncia Llama3 y ya está disponible en Azure AI Studio
Meta acaba de anunciar la disponibilidad de Llama3 y lo que más mola es que ya está disponible en Microsoft Azure AI Studio.
Llama 3 es un modelo open source que destaca en matices lingüísticos, comprensión contextual y tareas complejas como la traducción y la generación de diálogos.
Con una escalabilidad y un rendimiento mejorados, Llama 3 puede gestionar tareas de varios pasos sin esfuerzo, mientras que sus refinados procesos de post-entrenamiento reducen significativamente las tasas de falsos rechazos, mejoran la alineación de las respuestas y aumentan la diversidad en las respuestas del modelo. Además, eleva drásticamente capacidades como el razonamiento, la generación de código y el seguimiento de instrucciones.
«Nuestra última generación de modelos que está estableciendo un nuevo estándar de rendimiento y eficiencia de vanguardia para LLMs disponibles abiertamente»
META
Los LLM avanzan sin parar
La carrera de los LLM se está poniendo al rojo vivo, con muchos modelos alcanzando ya las capacidades del GPT-4.
El último modelo de Cohere, Command R+, ha alcanzado recientemente el sexto puesto, ¡igualando el nivel GPT-4 por más de 13.000 votos humanos!
Claude 3 Opus de Anthropic supera a GPT-4 en pruebas de referencia comunes como MMLU y HumanEval. Por su parte, Elon Musk ha anunciado que el próximo modelo de xAI, Grok-2, se empezará a entrenar en mayo y se espera que supere a GPT-4. Más recientemente, Mistral ha presentado su último modelo, 8X22B.
Por otro lado, Gemini 1.5 de Google, que incorpora la ventana contextual más larga de 1 millón, ya está disponible en más de 180 países a través de la API Gemini. También incluye capacidad nativa de comprensión de audio (voz) y una nueva API de archivos para simplificar su manejo.
Apple tampoco se queda atrás. Su último modelo LLM, ReALM, iguala el rendimiento de OpenAI GPT-4.
OpenAI se está espabilando
Es bastante raro que OpenAI se ponga al día con los nuevos modelos que surgen en el mercado. Aunque GPT-4 ha mantenido su primera posición durante el último año, ha perdido su liderazgo por primera vez.
En la reciente Google Next 24, Google mejoró varias capacidades de Gemini 1.5 Pro, entre ellas una mejor instrucción del sistema y el modo JSON. Poco después, OpenAI también anunció GPT-4 Turbo con Vision, que cuenta con «capacidades de razonamiento mejoradas».
El lanzamiento por parte de OpenAI de GPT-4 Turbo con Vision es sin duda una medida provisional para garantizar que siguen siendo relevante.
El propio Altman opina que, aunque la GPT-4 es estupendo, ya es hora de que la empresa presente un nuevo modelo mucho mejor que la GPT-4. «Creo que es una mierda», dijo Altman respecto a la GPT-4 en una entrevista reciente con Lex Fridman. «Espero que el delta entre el 5 y el 4 sea el mismo que entre el 4 y el 3», añadió.
Dijo además que la compañía lanzará GPT-5 en los «próximos meses», y añadió que OpenAI tiene cosas más importantes que lanzar antes de GPT-5. «Antes de hablar de un modelo similar a GPT -5… sé que tenemos muchas otras cosas importantes que lanzar primero», dijo Altman.
En el episodio de «Unconfuse Me with Bill Gates«, Altman también habló largo y tendido con Gates sobre cómo GPT-5 haría hincapié en la personalización. «La capacidad de saber de ti, de tu correo electrónico, de tu calendario, de cómo te gusta reservar citas, de conectarte a otras fuentes de datos externas… todo eso. Esas serán algunas de las áreas de mejora más importantes», afirmó Altman.
Además, afirmó que GPT-5 tendrá capacidades de razonamiento mucho mejores. «GPT-4 sólo puede razonar de forma muy limitada. También preocupa la fiabilidad. Si le haces a GPT-4 la mayoría de las preguntas 10.000 veces, probablemente una de esas 10.000 sea bastante buena, pero no siempre sabe cuál. Te gustaría obtener la mejor respuesta de las 10.000 cada vez», afirma Altman.
Y mientras OpenAI sigue trabajando sobre GPT-5, Meta ya ha lanzado Llama 3.
Llama 3 de META
Los modelos perfeccionados de Llama 3, diseñados para mantener diálogos, han demostrado un rendimiento impresionante en diversas pruebas. En las evaluaciones humanas de su utilidad y seguridad, estos modelos han demostrado estar a la altura de sus homólogos de código cerrado más populares, según el blog de Microsoft.
Meta ofrece las API de Llama-3-8B junto con capacidades de ajuste alojadas a través de Azure AI Studio. Azure AI Studio es una plataforma robusta diseñada para el desarrollo de aplicaciones de IA Generativa, que permite probar modelos, Prompt Flow para la ingeniería rápida, y RAG (Retrieval Augmented Generation) para la integración perfecta de los datos en las aplicaciones.
Con esta oferta, los usuarios pueden aprovechar las API de Llama-3-8B mediante un sistema de pago por uso, en el que la facturación se basa en los tokens de entrada y salida utilizados.
Además, en el caso de los modelos compatibles con el ajuste fino, los trabajos de ajuste fino se facturan por horas, y la inferencia de los modelos ajustados incurre en cargos basados en el uso de tokens junto con una tarifa de alojamiento por hora.
La integración con Azure AI Studio simplifica el proceso de suscripción para acceder y utilizar los modelos Llama 3 de Meta, ofreciendo un entorno completo para el desarrollo y despliegue de IA.
Llama 3: lo más destacado
- Modelos preentrenados y ajustados de 8B y 70B parámetros disponibles como open source.
- Entrenados en más de 15T de tokens, ¡más de 7 veces el conjunto de datos de Llama 2!
- Rendimiento de vanguardia en las pruebas de referencia del sector
- Nuevas funciones, incluido el razonamiento y la codificación mejorados
- Formación 3 veces más eficiente que Llama 2.
- Nuevas herramientas de confianza y seguridad con Llama Guard 2, Code Shield y CyberSec Eval 2.
- Formación en curso sobre un modelo puntero de parámetros 400B+.
Llama 3 en Azure
Llama3 en Meta.ai
También se ha lanzado en la web de meta.ai una nueva versión de Meta AI impulsada por Llama 3 que integra capacidades de búsqueda mejoradas.
Llama-3 en el ranking «LMSYS Chatbot Arena Leaderboard»
Llama-3 se sitúa en el puesto 5 del ranking de LMSYS Chatbot Arena que recopila más de 500.000 comparaciones humanas pareadas para clasificar los LLM según el modelo Bradley-Terry.
Le adelanta ahora mismo GPT-4-Turbo, GPT-4, Claude 3 y Bard (Gemini Pro).
Construye el futuro de la IA con Llama 3
Información basada la publicación de META: «Build the future of AI with Meta Llama 3«, el Azure marketplace «Meta Llama-3-8b Instruct«, «Meta Llama 3 Now Available on Microsoft Azure» y el LLM leaderboard,