Databricks se une a Azure: nuevos LLM disponibles en Azure
Mejorando la inteligencia artificial con Databricks en Azure: Incorporación de los últimos modelos lingüísticos de gran tamaño.
En el panorama en constante evolución de la inteligencia artificial (IA), la integración de modelos avanzados en plataformas accesibles cambia las reglas del juego tanto para los desarrolladores como para las empresas.
Desde hace unos días están disponibles los nuevos modelos de lenguaje de gran tamaño de Databricks, databricks/dbrx-base
y databricks/dbrx-instruct
, en el catálogo de modelos de IA de Microsoft Azure.
Esta adición refuerza el compromiso de Microsoft de ofrecer a sus clientes una selección diversa de modelos. Los nuevos modelos también están disponibles en Azure Databricks, en el marketplace de Databricks y como modelos abiertos de HuggingFace.
Databricks se une a Azure: Una sinergia de potencia y flexibilidad
Databricks es una de las empresas a la vanguardia del espacio de la IA y la analítica de big data, ofreciendo inteligencia de datos a todas las empresas al permitir a las organizaciones comprender y utilizar sus datos únicos para construir sus propios sistemas de IA.
La introducción de sus últimos modelos, databricks/dbrx-base
y databricks/dbrx-instruct
, en la plataforma Microsoft Azure AI y Azure Databricks, es un testimonio del compromiso conjunto de Microsoft con ellos para avanzar en la innovación de la IA a través del ciclo de vida del aprendizaje automático.
La asociación con Databricks es una colaboración destinada a mejorar el big data y la IA basados en la nube, centrada en la integración de la plataforma y las herramientas de Databricks con Microsoft Azure. Azure Databricks, una plataforma de análisis de datos basada en Spark, combinada con la infraestructura especialmente diseñada de Azure, proporciona un entorno de colaboración para ingenieros de datos, analistas de negocio y científicos de datos. Dentro de este ecosistema, los datos gestionados en Azure Databricks son fácilmente accesibles a través de OneLake en Microsoft Fabric mediante accesos directos intuitivos. Estos datos pueden ser utilizados en Azure AI Studio, mejorando los Large Language Models (LLMs) en el catálogo de modelos mediante la aplicación de un patrón de Retrieval-Augmented Generation (RAG) o afinando los modelos existentes, impulsando así la innovación y la excelencia en el desarrollo de IA.
La disponibilidad de databricks/dbrx-base
y databricks/dbrx-instruct
dentro del catálogo de modelos de IA de Microsoft Azure abre un abanico de posibilidades. Los desarrolladores pueden ahora integrar fácilmente estos modelos en sus proyectos, beneficiándose de la escalabilidad de Azure y de las capacidades avanzadas de datos de Databricks. Esta colaboración no sólo simplifica el proceso de desarrollo, sino que también fomenta la innovación, permitiendo la creación de aplicaciones inteligentes e intuitivas.
Explorando los nuevos modelos
DBRX se erige como un modelo pionero de Mezcla de Expertos (MoE), creado sobre las innovaciones de la investigación MegaBlocks y la iniciativa de código abierto de Databricks.
Este diseño impulsa al modelo a alcanzar una notable velocidad en tokens por segundo, sentando un precedente para futuros modelos de código abierto de última generación que adopten arquitecturas MoE. Con la friolera de 132B de parámetros, de los cuales 36B se activan para cualquier entrada, DBRX demuestra una capacidad sin parangón.
El modelo se sometió a un preentrenamiento en un vasto corpus de 12T tokens, procedentes de datos meticulosamente seleccionados, con soporte para hasta 32K tokens en longitud de contexto.
La construcción del conjunto de datos de entrenamiento aprovechó la amplia gama de herramientas de Databricks, incorporando Apache Spark™ y cuadernos de Databricks para el procesamiento de datos, junto con Unity Catalog para la gestión eficiente de datos y la gobernanza.
databricks/dbrx-base
Los modelos DBRX surgen como Large Language Models (LLMs) abiertos y versátiles, diseñados y licenciados para su aplicación tanto en el ámbito comercial como en el de la investigación. Estos modelos ofrecen la flexibilidad necesaria para adaptarse a una amplia gama de tareas específicas del procesamiento y la codificación del lenguaje natural.
databricks/dbrx-instruct
DBRX Instruct mejora el modelo base mediante un ajuste fino para interacciones instructivas concisas. Este modelo sirve como herramienta lista para usar para responder preguntas de pocos turnos («few-turn«), atendiendo a consultas en inglés general y tareas de programación.
Información basada en la publicación en la comunidad técnica de Microsoft: «Elevating AI with Databricks on Azure: Introducing the Latest Large Language Models«.