Tarea de Analytics de Azure Synapse

Se aplica a:SQL Server SSIS Integration Runtime en Azure Data Factory

Sugerencia

Microsoft Fabric Data Warehouse es un almacenamiento relacional de escala empresarial en una base de lago de datos, con una arquitectura lista para el futuro, inteligencia artificial integrada y nuevas características. Si no está familiarizado con el almacenamiento de datos, comience con Fabric Data Warehouse. Las cargas de trabajo del grupo dedicado de SQL pueden actualizarse a Fabric para acceder a funcionalidades avanzadas en ciencia de datos, análisis en tiempo real e informes.

La tarea de Azure Synapse Analytics permite que un paquete SSIS copie datos tabulares a un grupo de SQL dedicado de Azure Synapse Analytics desde el sistema de archivos o Azure Blob Storage. La tarea usa PolyBase para mejorar el rendimiento, tal como se describe en el artículo Azure Synapse Analytics Loading Patterns and Strategies (Patrones y estrategias de carga de Azure Synapse Analytics). El formato de archivo de origen de datos que se admite actualmente es texto delimitado en codificación UTF8. Al copiar desde el sistema de archivos, los datos primero se cargarán a Azure Blob Storage para su almacenamiento provisional y, luego, en el grupo de SQL dedicado. Por lo tanto, se necesita una cuenta de Azure Blob Storage.

Nota

No se admite el administrador de conexiones de Azure Storage con el tipo de servicio de Data Lake Gen2.

A fin de usar Azure Data Lake Gen2 para almacenamiento provisional u origen, puede conectarse mediante el administrador de conexiones de Azure Storage con el tipo de Azure Blob Storage.

La Tarea de Azure Synapse Analytics compone el Feature Pack de SQL Server Integration Services (SSIS) para Azure.

Para agregar una tarea de Azure Synapse Analytics, arrástrela desde el cuadro de herramientas de SSIS y suéltela en el lienzo de diseño. Luego, haga doble clic o clic con el botón derecho y seleccione Editar para que se muestre el cuadro de diálogo del editor de tareas.

En la página General , configure las propiedades siguientes.

SourceType especifica el tipo de almacén de datos de origen. Seleccione uno de estos tipos:

  • FileSystem: los datos de origen residen en el sistema de archivos local.
  • BlobStorage: los datos de origen residen en Azure Blob Storage.

Estas son las propiedades de cada tipo de origen.

Sistema de Archivos

Campo Descripción
DirectorioLocal Especifica el directorio local que contiene los archivos de datos que se van a cargar.
Recursivamente Especifica si los subdirectorios se deben buscar de forma recursiva.
nombre de archivo Especifica un filtro de nombre para seleccionar archivos con un determinado patrón de nombre. MiHoja*.xsl* incluirá archivos como MiHoja001.xsl y MiHojaABC.xslx.
RowDelimiter Especifica los caracteres que marcan el final de cada fila.
DelimitadorDeColumna Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa).
IsFirstRowHeader Especifica si la primera fila de cada archivo de datos contiene nombres de columna en lugar de datos reales.
AzureStorageConnection Especifica un administrador de conexiones de Azure Storage.
BlobContainer Especifica el nombre del contenedor de blobs en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase. Si no existe ningún contenedor, se creará uno.
BlobDirectory Especifica el directorio de blobs (estructura jerárquica virtual) en el que se cargarán los datos locales para retransmitirlos al grupo de SQL dedicado de Azure Synapse Analytics mediante PolyBase.
RetainFiles Especifica si se deben conservar los archivos cargados en Azure Storage.
TipoDeCompresión Especifica el formato de compresión que se usará al cargar archivos en Azure Storage. La fuente local no está afectada.
Nivel de Compresión Especifica el nivel de compresión que se usará para el formato de compresión.
SqlPoolConnection Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics.
TableName Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>.
TableDistribution Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName.
HashColumnName Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution.

BlobStorage

Campo Descripción
AzureStorageConnection Especifica un administrador de conexiones de Azure Storage.
BlobContainer Especifica el nombre del contenedor de blob en el que residen los datos de origen.
BlobDirectory Especifica el directorio de blobs (estructura jerárquica virtual) en el que residen los datos de origen.
RowDelimiter Especifica los caracteres que marcan el final de cada fila.
DelimitadorDeColumna Especifica uno o más caracteres que marcan el final de cada columna. Por ejemplo: | (barra vertical), \t (tabulación), ' (comilla simple), " (comilla doble) y 0x5c (barra diagonal inversa).
TipoDeCompresión Especifica el formato de compresión que se usa para los datos de origen.
SqlPoolConnection Especifica un administrador de conexiones ADO.NET para el grupo de SQL dedicado de Azure Synapse Analytics.
TableName Especifica el nombre de la tabla de destino. Elija un nombre de tabla existente o cree uno eligiendo <Nueva tabla ...>.
TableDistribution Especifica el método de distribución para la tabla nueva. Se aplica si se especifica un nuevo nombre de tabla para TableName.
HashColumnName Especifica la columna usada para la distribución de la tabla hash. Se aplica si HASH se ha especificado para TableDistribution.

Se mostrará otra página Asignaciones en función de si quiere copiar los datos en una tabla nueva o en una existente. En el caso anterior, configure las columnas de origen que se van a asignar y los nombres correspondientes en la tabla de destino que se creará. En el último caso, configure las relaciones de mapeo entre las columnas de origen y las de destino.

En la página Columnas , configure las propiedades de tipos de datos para cada columna de origen.

En la página T-SQL se muestra la instrucción T-SQL que se usa para cargar datos de Azure Blob Storage al grupo de SQL dedicado. La instrucción T-SQL se genera automáticamente a partir de configuraciones de otras páginas y se ejecuta como parte de la tarea. Puede editar manualmente la instrucción T-SQL generada para adaptarla a sus necesidades concretas haciendo clic en el botón Editar . Puede revertir a la versión que se genera automáticamente más tarde haciendo clic en el botón Restablecer.