Servicio de modelos con búsqueda automática de características

Model Serving puede buscar automáticamente los valores de las características de un almacén de características en línea de Databricks o de un almacén en línea de terceros. Para el servicio en tiempo real de valores de características, Databricks recomienda usar Databricks Online Feature Stores.

Requisitos

  • El modelo debe haber sido registrado con FeatureEngineeringClient.log_model (para ingeniería de atributos en Unity Catalog) o FeatureStoreClient.log_model (para el almacén de características del espacio de trabajo heredado), y requiere la versión v0.3.5 o posterior.

Nota:

Puede publicar la tabla de características en cualquier momento antes de la implementación del modelo, incluso después del entrenamiento de este.

Búsqueda automática de características

El servicio de modelos de Azure Databricks admite la búsqueda automática de características desde estos almacenes en línea:

La búsqueda automática de características es compatible con los tipos de datos siguientes:

  • IntegerType
  • FloatType
  • BooleanType
  • StringType
  • DoubleType
  • LongType
  • TimestampType
  • DateType
  • ShortType
  • ArrayType
  • MapType

Sobrescribir los valores de las características en la puntuación en línea de modelos

Todas las características requeridas por el modelo (indicadas con FeatureEngineeringClient.log_model o FeatureStoreClient.log_model) se consultan automáticamente en repositorios en línea para la evaluación del modelo. Para sobrescribir los valores de las características al puntuar un modelo mediante una API REST con Model Serving, incluya los valores de las características como parte de la carga útil de la API.

Nota:

Los nuevos valores de características deben ajustarse al tipo de datos de la característica según lo previsto por el modelo subyacente.

Guardar el dataframe aumentado en la tabla de inferencia

En el caso de puntos de conexión creados a partir de febrero de 2025, puede configurar un punto de conexión para servicio de modelo para registrar el DataFrame aumentado que contiene los valores de características buscados y los valores devueltos por la función. DataFrame se guarda en la tabla de inferencia para el modelo servido.

Para obtener instrucciones sobre cómo establecer esta configuración, consulte Búsqueda de características de registro DataFrames en tablas de inferencia.

Para obtener información sobre las tablas de inferencia, consulte Supervisar modelos servidos mediante tablas de inferencia habilitadas para Unity AI Gateway.

Ejemplos de cuadernos

Con Databricks Runtime 13.3 LTS y versiones posteriores, cualquier tabla Delta del Unity Catalog con una clave principal se puede usar como tabla de características. Cuando utiliza una tabla registrada en Unity Catalog como tabla de características, todas las capacidades de Unity Catalog están automáticamente disponibles para la tabla de características.

Tienda de características en línea de Databricks

En el cuaderno siguiente se muestra cómo publicar características en un almacén de características en línea de Databricks para la búsqueda automática de características y servicio en tiempo real.

Cuaderno de demostración de la tienda en línea de Databricks

Descargar el cuaderno

Tiendas en línea de terceros

En este cuaderno de ejemplo se muestra cómo publicar características en una tienda en línea de terceros y, a continuación, servir un modelo entrenado que busca automáticamente las características de la tienda en línea.

Cuaderno de ejemplo de almacén en línea de terceros (Unity Catalog)

Descargar el cuaderno

Almacén de características del área de trabajo (heredado)

En este cuaderno de ejemplo se muestra cómo publicar características en una tienda en línea y, a continuación, servir un modelo entrenado que busca automáticamente características de la tienda en línea.

Cuaderno de ejemplo para tienda online de terceros (Almacén de características del espacio de trabajo)

Descargar el cuaderno