Delen via


Les 1: Een project en basispakket maken met SQL Server Integration Services (SSIS)

van toepassing op:SQL Server SSIS Integration Runtime in Azure Data Factory

In deze les maakt u een eenvoudig ETL-pakket (extract, transform and load). Het pakket extraheert gegevens uit één platte bestandsbron, transformeert de gegevens met behulp van twee opzoektransformaties en schrijft de getransformeerde gegevens naar een kopie van de FactCurrencyRate feitentabel in de AdventureWorksDW2025 voorbeelddatabase. Als onderdeel van deze les maakt u nieuwe pakketten, voegt u gegevensbron- en doelverbindingen toe en configureert u deze en werkt u met nieuwe onderdelen van de besturingsstroom en gegevensstroom.

Voordat u een pakket maakt, moet u de opmaak begrijpen die wordt gebruikt in zowel de brongegevens als de bestemming. Vervolgens kunt u de transformaties definiëren die nodig zijn om de brongegevens toe te wijzen aan de bestemming.

Vereiste voorwaarden

Deze zelfstudie is afhankelijk van Microsoft SQL Server Data Tools, een set voorbeeldpakketten en een voorbeelddatabase.

Opmerking

De codevoorbeelden in dit artikel gebruiken de AdventureWorks2025 of AdventureWorksDW2025 voorbeelddatabase die u kunt downloaden van de startpagina van Microsoft SQL Server Samples en Community Projects .

Zie SQL Server Data Tools (SSDT) voor Visual Studio installeren voor instructies over het installeren van SQL Server Data Tools (SSDT).

Alle lespakketten voor deze zelfstudie downloaden:

  1. Navigeer naar Integration Services-zelfstudiebestanden.
  2. Selecteer de knop Downloaden .
  3. Koppel het Creating a Simple ETL Package.zip bestand en selecteer vervolgens Volgende.
  4. Nadat het bestand is gedownload, pak de inhoud uit in een lokale map.

De brongegevens bekijken

Voor deze zelfstudie zijn de brongegevens een set historische valutagegevens in een plat bestand met de naam SampleCurrencyData.txt. De brongegevens hebben de volgende vier kolommen: het gemiddelde tarief van de valuta, een valutasleutel, een datumsleutel en het einddatumtarief.

Hier volgt een voorbeeld van de brongegevens in het SampleCurrencyData.txt bestand:

1.00070049USD9/3/05 0:001.001201442
1.00020004USD9/4/05 0:001
1.00020004USD9/5/05 0:001.001201442
1.00020004USD9/6/05 0:001
1.00020004USD9/7/05 0:001.00070049
1.00070049USD9/8/05 0:000.99980004
1.00070049USD9/9/05 0:001.001502253
1.00070049USD9/10/05 0:000.99990001
1.00020004USD9/11/05 0:001.001101211
1.00020004USD9/12/05 0:000.99970009

Wanneer u werkt met platte bestandsbrongegevens, is het belangrijk om te begrijpen hoe de verbindingsbeheerder voor platte bestanden de platte bestandsgegevens interpreteert. Als de bron van het platte bestand Unicode is, definieert het verbindingsbeheer voor plat bestand alle kolommen zoals [DT_WSTR] met een standaardkolombreedte van 50. Als de platte bestandsbron ANSI-gecodeerd is, worden de kolommen gedefinieerd als [DT_STR] een standaardkolombreedte van 50. U moet deze standaardinstellingen waarschijnlijk wijzigen om de kolomtypen voor tekenreeksen meer van toepassing te maken voor uw gegevens. U moet het gegevenstype van de bestemming bekijken en vervolgens dat type kiezen in het verbindingsbeheer voor platte bestanden.

De doelgegevens bekijken

De bestemming voor de brongegevens is een kopie van de FactCurrencyRate feitentabel in AdventureWorksDW2025. De FactCurrencyRate feitentabel heeft vier kolommen en heeft relaties met twee dimensietabellen, zoals wordt weergegeven in de volgende tabel.

Kolomnaam Gegevenstype Opzoektabel Opzoekkolom
AverageRate float Geen Geen
CurrencyKey int (FK) 1 DimCurrency CurrencyKey (PK) 2
DateKey int (FK) 1 DimDate DateKey (PK) 2
EndOfDayRate float Geen Geen

1 FK: Vreemde sleutel

2 PK: primaire sleutel

De brongegevens toewijzen aan de bestemming

Onze analyse van de indelingen voor bron- en doelgegevens geeft aan dat zoekacties nodig zijn voor de CurrencyKey en DateKey waarden. Met de transformaties die deze zoekopdrachten uitvoeren, worden deze waarden opgehaald met behulp van de alternatieve sleutels uit de DimCurrency tabellen en DimDate dimensietabellen.

Kolom van een flat file Tabelnaam Kolomnaam Gegevenstype
0 FactCurrencyRate AverageRate float
1 DimCurrency CurrencyAlternateKey nchar(3)
2 DimDate FullDateAlternateKey date
3 FactCurrencyRate EndOfDayRate float

Lesopdrachten

Volgende stap