Remarque
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de vous connecter ou de modifier des répertoires.
L’accès à cette page nécessite une autorisation. Vous pouvez essayer de modifier des répertoires.
OneLake est le lac de données unifié unique pour Fabric. Chaque Fabric charge de travail lit et écrit des données via OneLake. Vous devez donc charger des données une seule fois pour l’utiliser partout. Vous pouvez importer des données dans OneLake de plusieurs façons :
- Chargez des fichiers directement dans un lac ou un entrepôt.
- Ingérer des données à l’aide de pipelines, de flux de données ou d’expériences de streaming.
- Connectez-vous à des données externes à l’aide de raccourcis ou de la mise en miroir.
Dans ce guide de démarrage rapide, vous apportez des données dans OneLake de deux façons : vous chargez un fichier CSV dans un lakehouse, et vous créez un raccourci dans OneLake à partir d’un second lakehouse qui pointe vers les mêmes données sans la copier. Lorsque vous avez terminé, vous disposez d’une table Delta interrogeable et d’un raccourci, tous deux disponibles pour chaque moteur de Fabric via OneLake.
Prerequisites
- Une licence Fabric. Vous pouvez également vous inscrire à un essai gratuit Fabric.
- Un espace de travail Fabric.
Créer un lakehouse.
Lorsque vous créez un élément Fabric, tel qu’un lakehouse, un entrepôt ou un eventhouse, cet élément approvisionne le stockage dans OneLake en votre nom. Dans ce guide de démarrage rapide, vous créez un lakehouse, qui vous donne à la fois une zone de fichier (Fichiers) pour des données non structurées ou semi-structurées et une zone de table Delta (Tables) pour les données structurées et interrogeables. Tout ce que vous placez dans l’une ou l’autre zone est stocké dans OneLake et accessible immédiatement à d’autres charges de travail Fabric.
Connectez-vous au portail Fabric et sélectionnez votre espace de travail.
Sélectionnez Nouvel élément.
Dans le volet Nouvel élément , recherchez et sélectionnez Lakehouse.
Entrez un nom, par exemple
DataLakehouse, puis sélectionnez Créer.Le lakehouse s’ouvre sur la vue Explorer, qui affiche des sections Tables et Files vides. Les deux sections sont déjà soutenues par OneLake et sont prêtes pour le contenu.
Télécharger des données d’exemple
Dans ce guide de démarrage rapide, vous utilisez Dim_Products.csv un exemple de modèle sémantique Fabric disponible publiquement. Il s’agit d’une petite table d’informations sur les produits d’un exemple de détaillant de café.
- Ouvrez un navigateur et accédez à https://fabrictutorialdata.blob.core.windows.net/sampledata/Coffee/Dim_Products.csv.
- Lorsque vous y êtes invité, enregistrez le fichier sous le nom
Dim_Products.csvdans un dossier de votre ordinateur.
Dans cette section, vous téléversez Dim_Products.csv dans Fichiers afin d’avoir des données sources brutes stockées dans OneLake. La zone Files d’un lac est une zone de stockage à usage général dans OneLake. Considérez-le comme la zone d’atterrissage pour les données brutes dans tout format qu’il arrive. Vous pouvez importer des fichiers CSV, JSON, Parquet, des images, des journaux ou tout autre type de données sans avoir à définir au préalable un schéma.
Dans l’explorateur Lakehouse, pointez sur Fichiers, sélectionnez le menu Plus d’options (...), puis sélectionnez Charger>des fichiers.
Dans le volet Charger des fichiers , sélectionnez l’icône de dossier et accédez à
Dim_Products.csvvotre ordinateur.Sélectionnez Charger, puis fermez le volet de chargement.
Sélectionnez le dossier Fichiers pour afficher son contenu et confirmez qu’il s’affiche
Dim_Products.csv.Sélectionnez cette option
Dim_Products.csvpour afficher ses données.
Le fichier se trouve désormais dans OneLake, mais en tant que csv brut, il n’est pas encore quelque chose que SQL ou Spark peut interroger en tant que table.
Charger le fichier dans une table Delta
Fabric adopte Delta Lake comme format de table dans OneLake. Lorsque vous chargez un fichier dans la zone Tables, Fabric lit le fichier source, déduit un schéma et écrit les données sous forme de table Delta. À partir de ce stade, chaque moteur de Fabric peut interroger la même table sans copier ou convertir à nouveau les données.
Dans l’explorateur Lakehouse, ouvrez le dossier Fichiers .
Survolez le fichier
Dim_Products.csvet sélectionnez le menu Plus d’options (...), puis sélectionnez Charger dans des tables>Nouvelle table.Dans la boîte de dialogue Charger dans la table , entrez le nom de la table, conservez
dim_productsles valeurs par défaut, puis sélectionnez Charger.Une fois le chargement terminé, développez Tables et sélectionnez
dim_productspour prévisualiser les lignes. Le fichier CSV brut dans Files est inchangé etdim_productsest une nouvelle table Delta créée à partir de celle-ci.
Pointez dessus
dim_productset sélectionnez le menu Plus d’options (...), puis sélectionnez Propriétés.L’écran Properties affiche les différents détails du tableau, notamment l’URL et le chemin d’accès Azure Blob File System (ABFS) que vous pouvez utiliser pour faire référence à ce tableau dans d’autres moteurs.
Réutiliser les données avec un raccourci provenant d’un second lakehouse
Le téléversement et le chargement constituent un moyen d’importer des données dans OneLake. L’autre modèle clé consiste à référencer des données qui existent déjà ailleurs, sans la dupliquer. C'est ce qu'est un raccourci : pointeur dans OneLake qui référence les données stockées dans un autre lakehouse, dans un autre espace de travail Fabric ou dans des sources prises en charge en dehors de Fabric comme Azure Data Lake Storage ou Amazon S3. Les données ne sont pas copiées ; il reste dans l’emplacement source, mais vous pouvez le lire via OneLake comme s’il était local. Toutes les mises à jour de la source sont immédiatement visibles via le raccourci. Vous n’avez donc pas besoin de conserver des copies des données.
Dans cette section, vous allez créer un deuxième lakehouse et y ajouter un raccourci pointant vers la table dim_products de votre premier lakehouse. Cela reflète le fonctionnement des équipes, où une équipe possède les données organisées et d’autres équipes ou projets l’consomment par le biais de raccourcis dans leurs propres espaces de travail.
- Dans votre espace de travail, sélectionnez Nouvel élément.
- Dans le volet Nouvel élément , recherchez et sélectionnez Lakehouse.
- Entrez un nom, par exemple
ShortcutLakehouse, puis sélectionnez Créer. - Dans l’Explorateur du nouveau lakehouse, pointez sur Tables, sélectionnez le menu Plus d’options (...), puis sélectionnez Nouveau raccourci.
- Dans la page New shortcut, sous Sourcesinternales, sélectionnez Microsoft OneLake.
- Dans le navigateur de sources de données, sélectionnez le premier lakehouse que vous avez créé pour ce démarrage rapide, puis sélectionnez Suivant.
- Développez Tables, sélectionnez la
dim_productstable, puis sélectionnez Suivant. - Passez en revue la sélection et sélectionnez Créer.
- Développez Tables dans
ShortcutLakehouseet confirmez quedim_productsapparaît avec une icône de raccourci (une petite image de lien superposée à l’icône de tableau). Sélectionnez-la pour afficher un aperçu des lignes. La table est la même que dans le lakehouse d’origine, mais aucune donnée n’a été copiée. - Pointez sur la table, sélectionnez plus d’options (
dim_products), puis sélectionnez Gérer le raccourci. Dans le volet Gérer les raccourcis , vous pouvez afficher les détails du raccourci, y compris la cible de raccourci dans laquelle les données d’origine sont stockées.
Nettoyer les ressources
Si vous ne prévoyez pas de passer aux autres guides de démarrage rapide OneLake, supprimez les lakehouses pour éviter les frais de stockage OneLake par rapport à votre capacité de Fabric.
- Dans votre espace de travail, placez le pointeur sur le lakehouse que vous souhaitez supprimer.
- Sélectionnez le menu Plus d’options (...) en regard de lakehouse, sélectionnez Supprimer, puis confirmez la suppression.
La suppression des lakehouses entraîne également celle de leur contenu : le fichier chargé, la table Delta dim_products et le raccourci.