🤖 Claude 3.5 Sonnet supera a GPT4o

Inteligencia Artificial

🤖 Claude 3.5 Sonnet supera a GPT4o

Ramón Rautenstrauch Actualizado a23/junio/2024

Con el lanzamiento de Claude 3.5 Sonnet, tenemos nuevo líder en los modelos del lenguaje, ya que se sitúa por encima de GPT4o.

Aquí podéis ver la evolución de los principales modelos en el tiempo:

Claude - GPT - Gemini

Esto es un avance significativo sobre todo para las personas que usan este tipo de modelos de lenguaje para copywriting. Si Claude 3 ya era superior a GPT para crear contenidos, esto es un paso más.

Claude 3.5 Sonnet va al doble de velocidad

Claude 3.5 Sonnet es un hito en el sector en cuanto a razonamiento de nivel universitario (GPQA), conocimientos de nivel universitario (MMLU) y competencia en codificación (HumanEval). Muestra una notable mejora en la captación de matices, humor e instrucciones complejas, y es excepcional en la redacción de contenidos de alta calidad con un tono natural y cercano.

Claude 3.5 Sonnet funciona al doble de velocidad que Claude 3 Opus. Este aumento del rendimiento, combinado con un precio rentable, hace que Claude 3.5 Sonnet sea ideal para tareas complejas, como la atención al cliente sensible al contexto y la orquestación de flujos de trabajo de varios pasos.

En una evaluación interna de codificación, Claude 3.5 Sonnet resolvió el 64% de los problemas, superando a Claude 3 Opus, que resolvió el 38%. Esta evaluación pone a prueba la capacidad del modelo para corregir un error o añadir funcionalidad a un código fuente abierto, dada una descripción en lenguaje natural de la mejora deseada. Cuando se le instruye y se le proporcionan las herramientas pertinentes, Claude 3.5 Sonnet puede escribir, editar y ejecutar código de forma independiente, con sofisticadas capacidades de razonamiento y resolución de problemas. Maneja traducciones de código con facilidad, lo que lo hace especialmente eficaz para actualizar aplicaciones heredadas y migrar bases de código.

Claude 3.5 Sonnet es un hito en el sector en cuanto a razonamiento de nivel universitario (GPQA), conocimientos de nivel universitario (MMLU) y competencia en codificación (HumanEval).

Modelo de visión de vanguardia

Claude 3.5 Sonnet es el modelo de visión más potente hasta la fecha, superando a Claude 3 Opus en las pruebas de visión estándar. Estas mejoras son más notables en tareas que requieren razonamiento visual, como la interpretación de tablas y gráficos. Claude 3.5 Sonnet también puede transcribir con precisión texto a partir de imágenes imperfectas, una capacidad esencial para el comercio minorista, la logística y los servicios financieros, donde la IA puede extraer más información de una imagen, gráfico o ilustración que del texto por sí solo.

Claude 3.5 Sonnet es el modelo de visión más potente hasta la fecha, superando a Claude 3 Opus en las pruebas de visión estándar.

Artefactos: una nueva forma de utilizar Claude

A su vez se han presentado los Artefactos en Claude.ai, una nueva función que amplía la forma en que los usuarios pueden interactuar con Claude. Cuando un usuario pide a Claude que genere contenido como fragmentos de código, documentos de texto o diseños de sitios web, estos Artefactos aparecen en una ventana dedicada junto a la conversación. Esto crea un espacio de trabajo dinámico en el que pueden ver, editar y construir sobre las creaciones de Claude en tiempo real, integrando perfectamente el contenido generado por IA en sus proyectos y flujos de trabajo.

Esta función de vista previa marca la evolución de Claude desde una IA conversacional a un entorno de trabajo colaborativo. Es sólo el principio de una visión más amplia de Claude.ai, que pronto se ampliará para dar soporte a la colaboración en equipo. En un futuro próximo, los equipos -y con el tiempo organizaciones enteras- podrán centralizar de forma segura sus conocimientos, documentos y trabajo en curso en un espacio compartido, con Claude como compañero de equipo a la carta.

¿Quieres saber más sobre la inteligencia artificial generativa? En DQS/ te asesoramos. ¿Por qué no nos preguntas cómo podemos ayudarte?

Información basada en la publicación oficial «Claude 3.5 Sonnet«.

Ramón Rautenstrauch

Conecta conmigo en LinkedIN
Apasionado ❤️ del Marketing. Microsoft MVP 😊. Evangelista Copilot 🤖. CMO 😍. SEO 🧠. Consultor IA y Dynamics 365 👨‍💻. Facilitador PLAYMOBILpro 💭.
Acerca de Ramón Rautenstrauch, autor de Consultor365.com

¿Te ha parecido interesante? ¿Tienes dudas sobre el contenido?
Para cualquier pregunta ponte en contacto conmigo.