Snabbstart: Hämta data till OneLake

OneLake är den enda enhetliga datasjön för Microsoft Fabric. Varje Fabric-arbetsbelastning läser och skriver data via OneLake, så du behöver bara ladda in data en gång för att använda den överallt. Du kan hämta data till OneLake på flera sätt:

  • Ladda upp filer direkt till ett sjöhus eller lager.
  • Mata in data med hjälp av pipelines, dataflöden eller direktuppspelningsupplevelser.
  • Anslut till externa data med hjälp av genvägar eller spegling.

I den här snabbstarten tar du data till OneLake på två sätt: du laddar upp en CSV-fil till ett lakehouse och skapar en OneLake-genväg från ett andra lakehouse som pekar tillbaka till samma data utan att kopiera den. När du är klar har du en Delta-tabell som går att fråga mot och en genväg, som båda är tillgängliga för alla Fabric-motorer via OneLake.

Förutsättningar

Skapa ett sjöhus

När du skapar ett Fabric objekt, till exempel ett lakehouse, lager eller händelsehus, etablerar objektet lagring i OneLake för din räkning. I den här snabbstarten skapar du ett lakehouse som ger dig både ett filområde (Filer) för ostrukturerade eller halvstrukturerade data och ett Delta-tabellområde (Tabeller) för strukturerade, frågebara data. Allt du lägger i endera området lagras i OneLake och är omedelbart tillgängligt för andra Fabric-arbetsbelastningar.

  1. Logga in på Fabric-portalen och välj din arbetsyta.

  2. Välj Nytt objekt.

  3. I fönstret Nytt objekt söker du efter och väljer Lakehouse.

  4. Ange ett namn, till exempel DataLakehouseoch välj sedan Skapa.

    Lakehouse öppnas i vyn Explorer, som visar tomma avsnitt för Tabeller och Filer. Båda avsnitten backas redan upp av OneLake och är redo för innehåll.

Ladda upp exempeldata

I den här snabbstarten använder du Dim_Products.csv från en offentligt tillgänglig Fabric exempeldatauppsättning. Det är en liten tabell med produktinformation från en kaffeåterförsäljare.

  1. Öppna en webbläsare och navigera till https://fabrictutorialdata.blob.core.windows.net/sampledata/Coffee/Dim_Products.csv.
  2. När du uppmanas att göra det sparar du filen som Dim_Products.csv i en mapp på datorn.

I det här avsnittet laddar du upp Dim_Products.csv till Filer så att du har råa källdata lagrade i OneLake. Området Filer i ett sjöhus är en allmän lagringszon i OneLake. Se det som landningszonen för rådata i vilket format den än kommer. Du kan släppa i CSV, JSON, Parquet, bilder, loggar eller något annat utan att behöva definiera ett schema först.

  1. Hovra över Filer i Lakehouse Explorer, välj menyn Fler alternativ (...) och välj sedan Ladda upp>uppladdningsfiler.

  2. I fönstret Ladda upp filer väljer du mappikonen och bläddrar till Dim_Products.csv på datorn.

  3. Välj Ladda upp och stäng sedan uppladdningsfönstret.

  4. Välj mappen Filer för att se innehållet och bekräfta att det Dim_Products.csv visas.

  5. Välj Dim_Products.csv för att se dess data.

    En skärmbild av Fabric-portalen som visar ostrukturerade CSV-data i sektionen Filer i ett lakehouse.

Filen finns nu i OneLake, men som en rå CSV är den ännu inte något SQL eller Spark kan fråga som en tabell.

Läs in filen i en Delta-tabell

Fabric standardiserar på Delta Lake som tabellformat i OneLake. När du läser in en fil i området Tables läser Fabric källfilen, härleder ett schema och skriver ut data som en Delta-tabell. Från och med då kan varje Fabric motor köra frågor mot samma tabell utan att du kopierar eller konverterar data igen.

  1. Öppna mappen Filer i Lakehouse Explorer.

  2. Hovra över Dim_Products.csv filen och välj menyn Fler alternativ (...) och välj sedan Läs in till Tabeller>Ny tabell.

  3. I dialogrutan Läs in till tabell anger du dim_products som tabellnamn, behåller standardvärdena och väljer Läs in.

  4. När belastningen är klar expanderar du Tabeller och väljer dim_products för att förhandsgranska raderna. Den råa CSV:n i Filer är oförändrad och dim_products är en ny Delta-tabell som skapats från den.

    En skärmbild som visar strukturerade Delta-tabelldata i avsnittet Tabeller i ett sjöhus.

  5. Hovra över dim_products och välj menyn Fler alternativ (...) och välj sedan Egenskaper.

    På skärmen Egenskaper visas olika uppgifter om tabellen, inklusive URL:en och Azure Blob File System-sökvägen (ABFS), som du kan använda för att referera till den här tabellen i andra motorer.

Återanvänd data med en genväg från ett annat lakehouse

Att ladda upp och läsa in är ett sätt att hämta data till OneLake. Det andra nyckelmönstret är att referera till data som redan finns någon annanstans, utan att duplicera dem. Det är det en genväg är: en pekare i OneLake som pekar på data som lagras i ett annat lakehouse, i en annan Fabric-arbetsyta eller i datakällor utanför Fabric som stöds, till exempel Azure Data Lake Storage eller Amazon S3. Data kopieras inte. den finns kvar på källplatsen, men du kan läsa den via OneLake som om den vore lokal. Alla uppdateringar av källan visas direkt via genvägen, så du behöver inte underhålla kopior av data.

I det här avsnittet skapar du ett andra sjöhus och lägger till en genväg från det tillbaka till dim_products tabellen i ditt första sjöhus. Detta återspeglar hur team vanligtvis arbetar, där ett team äger de granskade data och andra team eller projekt använder dem via genvägar på sina egna arbetsytor.

  1. Välj Nytt objekt på arbetsytan.
  2. I fönstret Nytt objekt söker du efter och väljer Lakehouse.
  3. Ange ett namn, till exempel ShortcutLakehouseoch välj sedan Skapa.
  4. Hovra över Tabeller i den nya Lakehouse-utforskaren, välj menyn Fler alternativ (...) och välj sedan Ny genväg.
  5. På sidan Ny genväg under Internal sources väljer du Microsoft OneLake.
  6. I datakällwebbläsaren väljer du det första lakehouse som du skapade för den här snabbstarten och sedan väljer du Nästa.
  7. Expandera Tabeller, välj dim_products tabellen och välj sedan Nästa.
  8. Granska markeringen och välj Skapa.
  9. Expandera Tabeller i ShortcutLakehouse och bekräfta att dim_products visas med en genvägsikon (en liten länkikon över tabellikonen). Välj den för att förhandsgranska raderna. Tabellen är densamma som i det ursprungliga sjöhuset, men inga data kopierades.
  10. Hovra över tabellen dim_products , välj fler alternativ (...) och välj sedan Hantera genväg. I fönstret Hantera genväg kan du visa genvägsinformationen, inklusive genvägsmålet där de ursprungliga data lagras.

Rensa resurser

Om du inte planerar att fortsätta med de andra OneLake-snabbstarterna bör du ta bort lakehouse-resurserna för att undvika OneLake-lagringsavgifter som belastar din Fabric-kapacitet.

  1. Hovra över det sjöhus som du vill ta bort på arbetsytan.
  2. Välj menyn Fler alternativ (...) bredvid lakehouse, välj Ta bort och bekräfta borttagningen.

Om du tar bort lakehouses tas även innehållet i dem bort: den uppladdade filen, dim_products Delta-tabellen och genvägen.