Nota:
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
Sugerencia
Pruebe Dataflow Gen2 en Data Factory en Microsoft Fabric, una solución de análisis todo en uno para empresas. Microsoft Fabric abarca todo, desde el movimiento de datos hasta la ciencia de datos, el análisis en tiempo real, la inteligencia empresarial y los informes. ¡Obtenga más información sobre cómo iniciar una nueva evaluación gratuita!
Los flujos de datos son una tecnología de preparación de datos basada en la nube y de autoservicio. Los flujos de datos permiten a los clientes ingerir, transformar y cargar datos en entornos de Microsoft Dataverse, áreas de trabajo de Power BI o la cuenta de Azure Data Lake Storage de la organización. Los flujos de datos se crean mediante Power Query, una experiencia unificada de conectividad y preparación de datos que ya se incluye en muchos productos de Microsoft, incluidos Excel y Power BI. Los clientes pueden desencadenar flujos de datos para ejecutarse a petición o automáticamente según una programación; los datos siempre se mantienen actualizados.
Los flujos de datos se pueden crear en varios productos de Microsoft
Los flujos de datos se incluyen en varios productos de Microsoft y no requieren que se cree o ejecute una licencia específica del flujo de datos. Los flujos de datos están disponibles en Power Apps, Power BI y Dynamics 365 Customer Insights. La capacidad de crear y ejecutar flujos de datos se agrupa con las licencias de esos productos. Las características de flujo de datos son principalmente comunes en todos los productos en los que se incluyen, pero algunas características específicas del producto pueden existir en flujos de datos creados en un producto frente a otro.
¿Cómo funciona el flujo de datos?
La imagen anterior muestra una vista general de cómo se define un flujo de datos. Un flujo de datos obtiene datos de orígenes de datos diferentes (ya se admiten más de 80 orígenes de datos). A continuación, en función de las transformaciones configuradas con la experiencia de creación de Power Query, el flujo de datos transforma los datos mediante el motor de flujo de datos. Por último, los datos se cargan en el destino de salida, que pueden ser un entorno de Microsoft Power Platform, un área de trabajo de Power BI o la cuenta de Azure Data Lake Storage de la organización.
Los flujos de datos se ejecutan en la nube
Los flujos de datos se basan en la nube. Cuando se crea y guarda un flujo de datos, su definición se almacena en la nube. Un flujo de datos también se ejecuta en la nube. Sin embargo, si un origen de datos es local, se puede usar una puerta de enlace de datos local para extraer los datos en la nube. Cuando se desencadena una ejecución de flujo de datos, la transformación y el cálculo de datos se producen en la nube y el destino siempre está en la nube.
Los flujos de datos usan un motor de transformación eficaz
Power Query es el motor de transformación de datos que se usa en el flujo de datos. Este motor es lo suficientemente capaz de admitir muchas transformaciones avanzadas. También usa una interfaz gráfica de usuario sencilla, pero eficaz denominada editor de Power Query. Puede usar flujos de datos con este editor para desarrollar soluciones de integración de datos de forma más rápida y sencilla.
Integración del flujo de datos con Microsoft Power Platform y Dynamics 365
Dado que un flujo de datos almacena las tablas resultantes en el almacenamiento basado en la nube, otros servicios pueden interactuar con los datos generados por flujos de datos.
Por ejemplo, las aplicaciones Power BI, Power Apps, Power Automate, Power Virtual Agents y Dynamics 365 pueden obtener los datos generados por el flujo de datos mediante la conexión a Dataverse, un conector de flujo de datos de Power Platform o directamente a través del lago, en función del destino configurado en el momento de creación del flujo de datos.
Ventajas de los flujos de datos
En la lista siguiente se resaltan algunas de las ventajas de usar flujos de datos:
Un flujo de datos desacopla la capa de transformación de datos de la capa de modelado y visualización en una solución de Power BI.
El código de transformación de datos puede residir en una ubicación central, un flujo de datos, en lugar de distribuirse entre varios artefactos.
Un creador de flujos de datos solo necesita Power Query aptitudes. En un entorno con varios creadores, el creador del flujo de datos puede formar parte de un equipo que compila toda la solución de BI o la aplicación operativa.
Un flujo de datos es independiente del producto. No es un componente de Power BI solo; puede obtener sus datos en otras herramientas y servicios.
Los flujos de datos aprovechan Power Query, una experiencia de transformación de datos eficaz, gráfica y de autoservicio.
Los flujos de datos se ejecutan completamente en la nube. No se requiere ninguna infraestructura adicional.
Tiene varias opciones para empezar a trabajar con flujos de datos, mediante licencias para Power Apps, Power BI y Customer Insights.
Aunque los flujos de datos son capaces de transformaciones avanzadas, están diseñados para escenarios de autoservicio y no requieren información sobre TI ni para desarrolladores.
Escenarios de casos de uso para flujos de datos
Puede usar flujos de datos para muchos fines. En los escenarios siguientes se proporcionan algunos ejemplos de casos de uso comunes para flujos de datos.
Migración de datos desde sistemas heredados
En este escenario, una organización decide usar Power Apps para la nueva experiencia de interfaz de usuario en lugar del sistema local heredado. Power Apps, Power Automate y AI Builder usan Dataverse como sistema de almacenamiento de datos principal. Los datos actuales del sistema local existente se pueden migrar a Dataverse mediante un flujo de datos y, a continuación, estos productos pueden usar esos datos.
Uso de flujos de datos para crear un almacenamiento de datos
Puede usar flujos de datos como reemplazo de otras herramientas de extracción, transformación, carga (ETL) para crear un almacenamiento de datos. En este escenario, los ingenieros de datos de una empresa deciden usar flujos de datos para crear su almacén de datos diseñado con un esquema en estrella, incluidas las tablas de hechos y dimensiones en Data Lake Storage. A continuación, se usa Power BI para generar informes y paneles mediante la obtención de datos de los flujos de datos.
Uso de flujos de datos para crear un modelo dimensional
Puede usar flujos de datos como reemplazo de otras herramientas de ETL para crear un modelo dimensional. Por ejemplo, los ingenieros de datos de una empresa deciden usar flujos de datos para crear el modelo dimensional diseñado con esquema de estrella, incluidas las tablas de hechos y dimensiones en Azure Data Lake Storage Gen2. A continuación, se usa Power BI para generar informes y paneles mediante la obtención de datos de los flujos de datos.
Centralización de la preparación y reutilización de datos de modelos semánticos en varias soluciones de Power BI
Si varias soluciones de Power BI usan la misma versión transformada de una tabla, el proceso para crear la tabla se repite varias veces. Esto aumenta la carga en el sistema de origen, consume más recursos y crea datos duplicados con varios puntos de error. En su lugar, se puede crear un único flujo de datos para calcular los datos de todas las soluciones. Power BI puede reutilizar el resultado de la transformación en todas las soluciones. El flujo de datos, si se usa de tal manera, puede formar parte de una arquitectura de implementación de Power BI sólida que evita los duplicados de código Power Query y reduce los costos de mantenimiento de la capa de integración de datos.