Almacenes de vectores en Azure Machine Learning (versión preliminar)

Importante

Esta característica actualmente está en su versión preliminar pública. Esta versión preliminar se ofrece sin un Acuerdo de Nivel de Servicio y no se recomienda para cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas.

Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

En este artículo se describen los almacenes de vectores en Azure Machine Learning que puede usar para realizar la generación aumentada de recuperación (RAG). Un almacén de vectores contiene incrustaciones, que son representaciones numéricas de conceptos (datos) convertidas en secuencias numéricas. Las incrustaciones permiten a los modelos de lenguaje grandes (LLM) comprender las relaciones entre conceptos. Puede crear almacenes de vectores para conectar los datos con VM como GPT-4 y recuperar datos de forma eficaz.

Azure Machine Learning admite dos almacenes de vectores que contienen los datos complementarios usados en un flujo de trabajo RAG:

Almacén de vectores Descripción Características y uso
Faiss Biblioteca de código abierto : usa un almacén basado en archivos local.
- Incurre en costos mínimos
- Admite datos de solo vector
- Admite desarrollo y pruebas
Azure AI Search Recurso de PaaS de Azure - Almacena datos de texto en índices de búsqueda
- Hospeda un gran número de índices con un único servicio.
- Admite los requisitos empresariales de nivel empresarial.
- Proporciona recuperación de información híbrida

En las secciones siguientes se exploran las consideraciones para trabajar con estos almacenes de vectores.

Biblioteca Faiss

Faiss es una biblioteca código abierto que proporciona un almacén basado en archivos local. El índice de vectores se almacena en la cuenta de almacenamiento de Azure del área de trabajo de Azure Machine Learning. Para trabajar con Faiss, descargue la biblioteca y úsela como componente de la solución. Dado que el índice se almacena localmente, los costos son mínimos.

Puede usar la biblioteca Faiss como almacén de vectores para realizar las siguientes acciones:

  • Almacenar datos vectoriales localmente sin costos para crear un índice (solo se aplican los costos de almacenamiento)

  • Compilar y consulta de un índice en memoria

  • Compartir copias para uso individual y configurar el hospedaje del índice para una aplicación

  • Escalado con proceso subyacente al cargar el índice

Azure AI Search es un recurso paaS de Azure dedicado que se crea en una suscripción de Azure. El recurso de Azure admite la recuperación de información sobre los datos vectoriales y textuales almacenados en los índices de búsqueda. Un flujo de avisos puede crear, rellenar y consultar los datos vectoriales almacenados en Azure AI Search. Un único servicio de búsqueda puede hospedar muchos índices, que se pueden consultar y usar en un patrón RAG.

Estos son los puntos clave sobre el uso de Azure AI Search para el almacén de vectores:

Para usar Azure AI Search como almacén de vectores para Azure Machine Learning, debe tener un servicio de búsqueda. Una vez que el servicio exista y conceda acceso a los desarrolladores, puede elegir Azure AI Search como índice vectorial en un flujo de solicitud. El flujo de aviso crea el índice en Azure AI Search, genera vectores de los datos de origen, envía los vectores al índice, invoca la búsqueda de similitud en Azure AI Search y devuelve la respuesta.