Vad är dataflöden?

Tips/Råd

Power BI Dataflow Gen1 är nu i ett äldre tillstånd och får ingen ny funktionsinvestering. För Premium-kunder med infrastrukturåtkomst är Dataflow Gen2 den rekommenderade sökvägen, som erbjuder förbättringar i prestanda, skalning, tillförlitlighet, funktioner och inbyggd AI. Pro/PPU-kunder kan fortsätta att använda Gen1, eftersom Gen2:s vägledning för dessa scenarier utvecklas. Information om uppgradering finns i Uppgradera från Dataflöde Gen1 till Dataflöde Gen2 .

Dataflöden är en molnbaserad dataförberedelseteknik med självbetjäning. Med dataflöden kan kunder mata in, transformera och läsa in data i Microsoft Dataverse miljöer, Power BI arbetsytor eller organisationens Azure Data Lake Storage konto. Dataflöden skapas med hjälp av Power Query, en enhetlig dataanslutning och förberedelseupplevelse som redan finns i många Microsoft produkter, inklusive Excel och Power BI. Kunder kan utlösa dataflöden för att köras antingen på begäran eller automatiskt, schemalagt; data hålls alltid uppdaterade.

Dataflöden kan skapas i flera Microsoft produkter

Dataflöden finns i flera Microsoft produkter och kräver inte att en dataflödesspecifik licens skapas eller körs. Dataflöden är tillgängliga i Power Apps, Power BI och Dynamics 365 Customer Insights. Möjligheten att skapa och köra dataflöden paketeras med dessa produkters licenser. Dataflödesfunktioner är oftast vanliga för alla produkter som de finns i, men vissa produktspecifika funktioner kan finnas i dataflöden som skapats i en produkt jämfört med en annan.

Hur fungerar dataflödet?

Diagram över hur dataflöden fungerar, från källdata, till omvandlingsprocessen och sedan till lagring.

Föregående bild visar en övergripande vy över hur ett dataflöde definieras. Ett dataflöde hämtar data från olika datakällor (fler än 80 datakällor stöds redan). Sedan, baserat på de transformeringar som konfigurerats med Power Query redigeringsmiljö, transformerar dataflödet datan med hjälp av dataflödesmotorn. Slutligen läses data in till utdatamålet, vilket kan vara en Microsoft Power Platform miljö, en Power BI arbetsyta eller organisationens Azure Data Lake Storage konto.

Dataflöden körs i molnet

Dataflöden är molnbaserade. När ett dataflöde skapas och sparas lagras dess definition i molnet. Ett dataflöde körs också i molnet. Men om en datakälla är lokal kan en lokal datagateway användas för att extrahera data till molnet. När en dataflödeskörning utlöses sker datatransformeringen och beräkningen i molnet och målet finns alltid i molnet.

Diagram över hur dataflöden körs i molnet, från datakällan, till dataflödet som körs i molnet och sedan till lagringen.

Dataflöden använder en kraftfull transformeringsmotor

Power Query är den datatransformeringsmotor som används i dataflödet. Den här motorn är tillräckligt kapabel för att stödja många avancerade omvandlingar. Den använder också ett enkelt, men kraftfullt, grafiskt användargränssnitt som heter Power Query editor. Du kan använda dataflöden med den här redigeraren för att utveckla dina dataintegreringslösningar snabbare och enklare.

Screenshot som visar ett exempel på Power Query transformationer.

Dataflödesintegrering med Microsoft Power Platform och Dynamics 365

Eftersom ett dataflöde lagrar de resulterande tabellerna i molnbaserad lagring kan andra tjänster interagera med data som produceras av dataflöden.

Diagram över hur ett dataflöde integreras med Microsoft Power Platform och Dynamics 365.

Till exempel kan Power BI, Power Apps, Power Automate, Power Virtual Agents och Dynamics 365 program hämta data som produceras av dataflödet genom att ansluta till Dataverse, en Power Platform-dataflödesanslutning eller direkt via sjön, beroende på målet som konfigurerats vid skapande av dataflöde.

Fördelar med dataflöden

I följande lista visas några av fördelarna med att använda dataflöden:

  • Ett dataflöde frikopplar datatransformeringslagret från modellerings- och visualiseringslagret i en Power BI lösning.

  • Datatransformeringskoden kan finnas på en central plats, ett dataflöde, i stället för att spridas ut mellan flera artefakter.

  • En dataflödesskapare behöver bara Power Query kunskaper. I en miljö med flera skapare kan dataflödesskapare ingå i ett team som tillsammans skapar hela BI-lösningen eller driftprogrammet.

  • Ett dataflöde är produktagnostiskt. Det är inte bara en komponent i Power BI. Du kan hämta dess data i andra verktyg och tjänster.

  • Dataflöden drar nytta av Power Query, en kraftfull, grafisk datatransformeringsupplevelse med självbetjäning.

  • Dataflöden körs helt i molnet. Ingen extra infrastruktur krävs.

  • Du har flera alternativ för att börja arbeta med dataflöden med hjälp av licenser för Power Apps, Power BI och Customer Insights.

  • Även om dataflöden kan utföra avancerade transformeringar är de utformade för självbetjäningsscenarier och kräver ingen IT- eller utvecklarbakgrund.

Användningsfallsscenarier för dataflöden

Du kan använda dataflöden i många syften. Följande scenarier innehåller några exempel på vanliga användningsfall för dataflöden.

Datamigrering från äldre system

I det här scenariot bestämmer sig en organisation för att använda Power Apps för den nya användargränssnittsupplevelsen i stället för det äldre lokala systemet. Power Apps, Power Automate och AI Builder alla använder Dataverse som primärt datalagringssystem. Aktuella data i det befintliga lokala systemet kan migreras till Dataverse med hjälp av ett dataflöde, och sedan kan dessa produkter använda dessa data.

Använda dataflöden för att skapa ett informationslager

Du kan använda dataflöden som ersättning för andra verktyg för extrahering, transformering, inläsning (ETL) för att skapa ett informationslager. I det här scenariot bestämmer sig datatekniker för ett företag för att använda dataflöden för att skapa sitt stjärnschemadesignade informationslager, inklusive fakta- och dimensionstabeller i Data Lake Storage. Sedan används Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Diagram över hur du skapar ett informationslager med hjälp av dataflöden.

Använda dataflöden för att skapa en dimensionsmodell

Du kan använda dataflöden som ersättning för andra ETL-verktyg för att skapa en dimensionsmodell. Till exempel bestämmer sig datatekniker för ett företag för att använda dataflöden för att skapa den stjärnschemadesignade dimensionsmodellen, inklusive fakta- och dimensionstabeller i Azure Data Lake Storage Gen2. Sedan används Power BI för att generera rapporter och instrumentpaneler genom att hämta data från dataflödena.

Diagram över hur du skapar en dimensionsmodell med hjälp av dataflöden.

Centralisera dataförberedelse och återanvändning av semantiska modeller i flera Power BI lösningar

Om flera Power BI lösningar använder samma transformerade version av en tabell upprepas processen för att skapa tabellen flera gånger. Detta ökar belastningen på källsystemet, förbrukar fler resurser och skapar duplicerade data med flera felpunkter. I stället kan du skapa ett enda dataflöde för att beräkna data för alla lösningar. Power BI kan sedan återanvända resultatet av omvandlingen i alla lösningar. Dataflödet kan, om det används på ett sådant sätt, vara en del av en robust Power BI implementeringsarkitektur som undviker Power Query koddbbletter och minskar underhållskostnaderna för dataintegreringslagret.

Diagram över hur tabeller kan återanvändas i flera lösningar.