Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
Conseil / Astuce
Power BI Dataflow Gen1 est désormais dans un état hérité et ne recevra pas de nouveaux investissements de fonctionnalités. Pour les clients Premium disposant d’un accès Fabric, Dataflow Gen2 est le chemin recommandé, offrant des améliorations des performances, de la mise à l’échelle, de la fiabilité, des fonctionnalités et de l’IA intégrée. Les clients Pro/PPU peuvent continuer à utiliser Gen1 car les orientations Gen2 pour ces scénarios évoluent. Pour obtenir des conseils sur la mise à niveau, consultez La mise à niveau de Dataflow Gen1 vers Dataflow Gen2 .
Les flux de données sont une technologie de préparation des données en libre-service, basée sur le cloud. Les flux de données permettent aux clients d'ingérer, de transformer et de charger des données dans des environnements Microsoft Dataverse, des espaces de travail Power BI ou du compte de Azure Data Lake Storage de votre organisation. Les dataflows sont créés à l’aide de Power Query, d’une expérience unifiée de connectivité et de préparation des données déjà proposée dans de nombreux produits Microsoft, notamment Excel et Power BI. Les clients peuvent déclencher des flux de données pour s’exécuter à la demande ou automatiquement selon une planification ; les données sont toujours conservées à jour.
Les dataflows peuvent être créés dans plusieurs produits Microsoft
Les flux de données sont proposés dans plusieurs produits Microsoft et ne nécessitent pas de licence spécifique au flux de données pour être créés ou exécutés. Les dataflows sont disponibles dans Power Apps, Power BI et Dynamics 365 Customer Insights. La possibilité de créer et d’exécuter des flux de données est groupée avec les licences de ces produits. Les fonctionnalités de flux de données sont principalement courantes dans tous les produits dans lesquels elles sont proposées, mais certaines fonctionnalités spécifiques au produit peuvent exister dans les flux de données créés dans un produit par rapport à un autre.
Comment fonctionne le flux de données ?
L’image précédente montre une vue globale de la façon dont un flux de données est défini. Un dataflow obtient des données provenant de différentes sources de données (plus de 80 sources de données sont déjà prises en charge). Ensuite, en fonction des transformations configurées avec l’expérience de création Power Query, le flux de données transforme les données à l’aide du moteur de flux de données. Enfin, les données sont chargées dans la destination de sortie, qui peut être un environnement Microsoft Power Platform, un espace de travail Power BI ou le compte Azure Data Lake Storage de l'organisation.
Les flux de données s’exécutent dans le cloud
Les dataflows sont basés sur le cloud. Lorsqu’un dataflow est créé et enregistré, sa définition est stockée dans le cloud. Un flux de données s’exécute également dans le cloud. Toutefois, si une source de données est locale, une passerelle de données locale peut être utilisée pour extraire les données dans le cloud. Lorsqu’une exécution de flux de données est déclenchée, la transformation et le calcul des données se produisent dans le cloud, et la destination est toujours dans le cloud.
Les dataflows utilisent un moteur de transformation puissant
Power Query est le moteur de transformation de données utilisé dans le flux de données. Ce moteur est suffisamment capable de prendre en charge de nombreuses transformations avancées. Il utilise également une interface utilisateur graphique simple, mais puissante appelée éditeur Power Query. Vous pouvez utiliser des dataflows avec cet éditeur pour développer vos solutions d’intégration de données plus rapidement et plus facilement.
Intégration du flux de données avec Microsoft Power Platform et Dynamics 365
Étant donné qu’un dataflow stocke les tables résultantes dans le stockage cloud, d’autres services peuvent interagir avec les données produites par des dataflows.
Par exemple, Power BI, Power Apps, Power Automate, Power Virtual Agents et Dynamics 365 applications peuvent obtenir les données produites par le dataflow en se connectant à Dataverse, à un connecteur de flux de données Power Platform ou directement via le lac, selon la destination configurée au moment de la création du flux de données.
Avantages des dataflows
La liste suivante met en évidence certains des avantages de l’utilisation de dataflows :
Un flux de données dissocie la couche de transformation de données de la couche de modélisation et de visualisation dans une solution Power BI.
Le code de transformation de données peut résider dans un emplacement central, un flux de données plutôt qu’être réparti entre plusieurs artefacts.
Un créateur de flux de données n’a besoin que de compétences Power Query. Dans un environnement avec plusieurs créateurs, le créateur de flux de données peut faire partie d’une équipe qui crée ensemble l’ensemble de la solution BI ou de l’application opérationnelle.
Un dataflow est indépendant du produit. Ce n'est pas un composant de Power BI uniquement ; vous pouvez obtenir ses données dans d'autres outils et services.
Les dataflows tirent parti de Power Query, une expérience de transformation de données en libre-service puissante et graphique.
Les flux de données s’exécutent entièrement dans le cloud. Aucune infrastructure supplémentaire n’est requise.
Vous avez plusieurs options pour commencer à utiliser des flux de données, en utilisant des licences pour Power Apps, Power BI et Customer Insights.
Bien que les flux de données soient capables de transformations avancées, ils sont conçus pour les scénarios en libre-service et ne nécessitent pas d’arrière-plan informatique ou développeur.
Scénarios d’utilisation pour les flux de données
Vous pouvez utiliser des dataflows à de nombreuses fins. Les scénarios suivants fournissent quelques exemples de cas d’usage courants pour les flux de données.
Migration de données à partir de systèmes hérités
Dans ce scénario, une organisation décide d’utiliser Power Apps pour la nouvelle expérience d’interface utilisateur plutôt que pour le système local hérité. Power Apps, Power Automate et AI Builder toutes utiliser Dataverse comme système de stockage de données principal. Les données actuelles du système local existant peuvent être migrées vers Dataverse à l’aide d’un dataflow, puis ces produits peuvent utiliser ces données.
Utilisation de dataflows pour créer un entrepôt de données
Vous pouvez utiliser des dataflows comme remplacement d’autres outils d’extraction, de transformation, de chargement (ETL) pour créer un entrepôt de données. Dans ce scénario, les ingénieurs de données d'une entreprise décident d'utiliser des flux de données pour créer leur entrepôt de données conçu selon le schéma en étoile, y compris les tables de faits et de dimension dans Data Lake Storage. Ensuite, Power BI est utilisée pour générer des rapports et des tableaux de bord en obtenant des données à partir des dataflows.
Utilisation de dataflows pour créer un modèle dimensionnel
Vous pouvez utiliser des dataflows comme remplacement d’autres outils ETL pour créer un modèle dimensionnel. Par exemple, les ingénieurs de données d'une entreprise décident d'utiliser des flux de données pour créer le modèle dimensionnel conçu selon le schéma en étoile, y compris les tables de faits et de dimensions dans Azure Data Lake Storage Gen2. Ensuite, Power BI est utilisée pour générer des rapports et des tableaux de bord en obtenant des données à partir des dataflows.
Centraliser la préparation et la réutilisation des modèles sémantiques sur plusieurs solutions Power BI
Si plusieurs solutions Power BI utilisent la même version transformée d’une table, le processus de création de la table est répété plusieurs fois. Cela augmente la charge sur le système source, consomme davantage de ressources et crée des données en double avec plusieurs points de défaillance. Au lieu de cela, un flux de données unique peut être créé pour calculer les données de toutes les solutions. Power BI pouvez ensuite réutiliser le résultat de la transformation dans toutes les solutions. Le flux de données, s’il est utilisé de telle manière, peut faire partie d’une architecture d’implémentation robuste Power BI qui évite les doublons de code Power Query et réduit les coûts de maintenance de la couche d’intégration de données.