Azure AI Document Intelligence
AI Document Intelligence es un servicio de IA que aplica aprendizaje automático avanzado para extraer texto, pares clave-valor, tablas y estructuras de documentos de forma automática y precisa.
AI Document Intelligence convierte los documentos en datos utilizables y el usuario puede centrarse en actuar sobre la información en lugar de recopilarla.
Se puede empezar con modelos predefinidos o crear modelos personalizados adaptados a tus documentos, tanto on premise como en la nube, con AI Document Intelligence studio o el SDK.
Para que uso yo AI Document Intelligence
Para alimentar los RAG con documentos personalizados. Es la mejor forma. Microsoft Azure Document Intelligence es un OCR súper potente y funciona. Siempre.
La Generación Mejorada por Recuperación (RAG) es una potente herramienta para mejorar el rendimiento de los Grandes Modelos Lingüísticos (LLM) mediante la incorporación de conocimiento externo al proceso de generación.
No hace falta formatear los documentos y con todo tipo de documentos que lo he probado tiene una precisión del 100% con búsqueda híbrida (semántica + palabra clave).
¿Qué es la generación mejorada por recuperación (RAG)?
En este artículo tienes la explicación: «La generación mejorada por recuperación (RAG · Retrieval-Augmented Generation) es el proceso de optimización de la salida de un modelo lingüístico de gran tamaño, de modo que haga referencia a una base de conocimientos autorizada fuera de los orígenes de datos de entrenamiento antes de generar una respuesta.»
¿Qué hace AI Document Intelligence?
Extrae texto y estructura de documentos rápidamente.
Extracción de texto sencilla
Extraiga datos y organice la información fácilmente con funciones prediseñadas y personalizadas, sin necesidad de etiquetado manual.
Resultados personalizados
Obtenga resultados adaptados a sus diseños con la extracción automática personalizada y mejórelos con comentarios humanos.
Despliegue flexible
Ingiera datos desde la nube o en el perímetro y aplíquelos a índices de búsqueda, flujos de trabajo de automatización empresarial, etc.
Seguridad integrada
Confíe en la seguridad y privacidad de nivel empresarial aplicada tanto a sus datos como a cualquier modelo entrenado.
Precios de Azure AI Document Intelligence
Document Intelligence clasifica documentos, extrae campos o pares clave-valor y estructuras como tablas, marcas de selección de documentos y formularios. El servicio incluye las siguientes opciones:
- Extracción de campos personalizados: Document Intelligence aprende la estructura de tus documentos (facturas, contratos, extractos, registros específicos del sector) para extraer de forma inteligente campos, texto y datos. Extrae texto de formularios y documentos para generar datos estructurados que incluyen los campos, las tablas y el contenido. Puedes extraer información de forma rápida, precisa y adaptada a tu contenido específico, sin necesidad de una gran intervención manual ni de amplios conocimientos de aprendizaje automático.
- Clasificación/División personalizada – Document Intelligence aprende de tus documentos para clasificarlos de forma inteligente en diferentes tipos. Si un archivo consta de varios documentos de distintos tipos, también identificará automáticamente los límites de los documentos para su posterior procesamiento.
- Preconstruidos – Document Intelligence admite varios modelos preconstruidos para tipos de documentos comunes. Detecta y extrae datos de recibos, facturas, así como de formularios fiscales, seguros y tarjetas sanitarias mediante el reconocimiento óptico de caracteres (OCR). Los modelos predefinidos extraen la información según un esquema definido.
- Maquetación – Detecta y extrae texto y estructuras (tablas, títulos, párrafos, marcas de selección) de documentos mediante OCR.
Aquí tienes la lista de precios en euros (tanto en pago por uso como en suscripción mensual): Azure AI Document Intelligence pricing
La información oficial sobre Azure AI Document Intelligence la puedes encontrar aquí: «Azure AI Document Intelligence · Accelerate information extraction from documents«.