Elegir un modo de almacenamiento

Completado

La primera decisión de diseño para cualquier modelo semántico en Microsoft Fabric es cómo fluyen los datos al modelo. El modo de almacenamiento que elija afecta al rendimiento de las consultas, a la actualización de datos y a qué características Fabric están disponibles. En Fabric, Direct Lake es el valor predeterminado y, para la mayoría de las cargas de trabajo, es la opción correcta.

Modo Direct Lake

Direct Lake es el modo de almacenamiento predeterminado para los modelos semánticos creados en Microsoft Fabric. A diferencia del modo de importación, Direct Lake no copia datos en el modelo. A diferencia de DirectQuery, no traduce las consultas a SQL de origen. En su lugar, Direct Lake lee las tablas Delta directamente desde OneLake en la memoria, que combina la velocidad de importación con la actualización de DirectQuery.

Cuando un usuario abre un informe respaldado por un modelo semántico de Direct Lake, el motor carga los datos de las columnas de archivos Delta Parquet según demanda. No es necesario programar una actualización, como sucede con el modo de importación. Cuando se actualizan las tablas Delta subyacentes, el modelo refleja esos cambios.

Los modelos de Direct Lake habilitan automáticamente el formato de almacenamiento de modelo semántico grande. Esta configuración quita el límite de tamaño del modelo de 10 GB y es un requisito previo para el escalado de consultas y el acceso de lectura/escritura al punto de conexión XMLA. No es necesario habilitarlo manualmente para los modelos de Direct Lake.

Opciones de conexión de Direct Lake

Los modelos de Direct Lake pueden conectarse a los datos a través de dos rutas de acceso:

  • Tablas oneLake: el modelo se conecta directamente a las tablas delta en un almacén o una casa de lago. Esta es la ruta de acceso más sencilla y funciona bien cuando los datos están en un único almacén de datos Fabric.
  • Punto final de SQL Analytics: El modelo se conecta a través del punto final SQL de un lakehouse o un almacén. Esta ruta de acceso permite el acceso a vistas, consultas entre bases de datos y características de seguridad definidas en la capa de SQL.

Elija tablas de OneLake cuando los datos son sencillos y residen en un solo lugar. Elija el punto de conexión de SQL Analytics cuando necesite vistas, combinaciones entre orígenes o seguridad de nivel de fila definida en SQL.

Comportamiento predeterminado

Algunas operaciones pueden hacer que un modelo de Direct Lake vuelva al modo DirectQuery. Los cálculos DAX complejos, las consultas que superan la memoria disponible o ciertas operaciones no admitidas desencadenan este mecanismo de respaldo. Cuando se produce la reversión, la consulta se ejecuta en el punto de conexión de análisis SQL en lugar de leer directamente los archivos Delta.

Configure el comportamiento de respaldo en la configuración del modelo semántico:

  • Permitir regresión: las consultas que no se pueden ejecutar en modo Direct Lake se retornan automáticamente a DirectQuery. El usuario obtiene resultados, pero el rendimiento podría disminuir.
  • No permitir alternativas: las consultas que no se pueden ejecutar en el modo Direct Lake devuelven un error. Esta opción aplica un rendimiento coherente, pero requiere que todas las consultas permanezcan dentro de las funcionalidades de Direct Lake.

Para la mayoría de las cargas de trabajo de producción, comience con el mecanismo de respaldo permitido y supervise qué consultas lo activan. A continuación, optimice esas consultas o estructuras de datos para reducir la frecuencia de retorno con el tiempo.

Modo de importación

El modo de importación copia los datos en el modelo semántico y los almacena en un formato comprimido en memoria. Las consultas se ejecutan en la copia local, lo que hace que el modo de Importación sea el más rápido para el rendimiento de las consultas. Sin embargo, los datos solo son tan actuales como la última actualización.

El modo de importación es la opción correcta cuando:

  • El origen de datos está fuera de Fabric (bases de datos locales, API de terceros, archivos planos).
  • El rendimiento de las consultas es la máxima prioridad y no es necesario que las actualizaciones sean en casi tiempo real.
  • Necesita características que aún no se admiten en Direct Lake.

Sugerencia

Al usar el modo de importación, conéctese a vistas en lugar de tablas sin formato, incluya solo las columnas necesarias y use los tipos de datos adecuados para reducir el tamaño del modelo. Obtenga más información sobre las técnicas para reducir los datos cargados en modelos de importación.

Modo DirectQuery

DirectQuery envía consultas directamente al origen de datos en el momento de la consulta. No se almacena ningún dato en el modelo, lo que hace que DirectQuery sea adecuado para escenarios de datos en tiempo real y conjuntos de datos muy grandes que no se pueden importar.

El equilibrio es el rendimiento. Cada interacción del informe genera una consulta en el sistema de origen. DirectQuery funciona mejor cuando:

  • Los datos en tiempo real son necesarios e incluso los retrasos de actualización cortos no son aceptables.
  • Los volúmenes de datos de origen son demasiado grandes para importar y el origen de datos está fuera de Fabric.
  • Los requisitos de gobernanza exigen que los datos permanezcan en el origen.

Sugerencia

Para obtener más información, consulte Guía del modelo de DirectQuery.

Modo compuesto

El modo compuesto combina los modos de almacenamiento dentro de un único modelo. Algunas tablas usan Import, mientras que otras usan DirectQuery o Direct Lake. Esto proporciona flexibilidad para escenarios en los que las distintas tablas tienen diferentes necesidades de rendimiento y actualización.

Por ejemplo, una tabla de hechos grande podría permanecer en Direct Lake mientras que una pequeña tabla de referencia de un origen externo usa Import. El modo compuesto también permite relaciones de varios a varios entre tablas de distintos orígenes de datos.

Use el modo compuesto cuando:

  • Se necesitan datos de orígenes de Fabric y de orígenes no pertenecientes a Fabric en el mismo modelo.
  • Algunas tablas requieren datos en tiempo real, mientras que otras se benefician del rendimiento almacenado en caché.
  • Debe combinar tablas de Direct Lake con tablas de importación para el análisis de múltiples fuentes.

Elección del modo de almacenamiento adecuado

En la tabla siguiente se resume cuándo elegir cada modo:

Modo Ubicación de datos Velocidad de consulta Actualización de datos Más adecuado para
Direct Lake OneLake (tablas Delta) Rápido Casi en tiempo real cargas de trabajo nativas de Fabric (valor predeterminado)
Importación Caché en el modelo El más rápido Dependiente de la recarga Orígenes no Fabric, rendimiento máximo
DirectQuery Sistema de origen Depende del sistema de origen Casi en tiempo real Requisitos en tiempo real, datos externos muy grandes
Composite Mixto Varía Mixto Escenarios multifuente y requisitos híbridos

El modo de almacenamiento también afecta al consumo de IA. Cuando Copilot o agentes de datos consultan un modelo semántico, devuelven respuestas basadas en los datos que el modelo refleja actualmente. La actualización casi en tiempo real de Direct Lake significa que las consultas de IA devuelven resultados actuales sin esperar una actualización programada. En el caso de los modelos que sirven tanto a los usuarios humanos como a la inteligencia artificial, la elección del modo de almacenamiento afecta directamente a la calidad de ambas experiencias.

En Fabric, comience con Direct Lake. Vaya a otro modo solo cuando el escenario específico lo requiera.