Transformer les données en exécutant un notebook

Utilisez l’activité Notebook pour exécuter les notebooks que vous créez dans Microsoft Fabric dans le cadre de vos pipelines de Data Factory. Les blocs-notes vous permettent d’exécuter des travaux Apache Spark pour les intégrer, nettoyer ou transformer vos données dans le cadre de vos flux de travail de données. Il est facile d’ajouter une activité Notebook à vos pipelines dans Fabric, et ce guide vous guide tout au long de chaque étape.

Prérequis

Pour commencer, vous devez remplir les conditions préalables suivantes :

Pour accéder à Microsoft Fabric, vous devez avoir un locataire qui dispose d'une capacité provisionnée. Vous pouvez essayer Fabric avec une période d'essai gratuite.
Un Fabric workspace affecté à cette capacité.

Un carnet est créé dans votre espace de travail. Pour créer un bloc-notes, reportez-vous à How to create Microsoft Fabric notebooks.

Créer une activité de cahier

Créez un nouveau pipeline dans votre espace de travail.
Recherchez Notebook dans le volet Activités du pipeline et sélectionnez-le pour l'ajouter au canevas du pipeline.
Sélectionnez la nouvelle activité Notebook sur le canevas si elle n'est pas déjà sélectionnée.

Reportez-vous aux instructions relatives aux paramètres Général pour configurer l’onglet Paramètres Général .

Configurer les paramètres du bloc-notes

Sélectionnez l’onglet Paramètres.

Sous Connexion, sélectionnez la méthode d’authentification pour l’exécution du notebook et fournissez les informations d’identification requises.

Sélectionnez un bloc-notes existant dans la liste déroulante Notebook , puis spécifiez éventuellement les paramètres à passer au bloc-notes.

Capture d'écran montrant l'onglet Paramètres du notebook mettant en évidence l'onglet, où choisir un notebook et où ajouter des paramètres.

Utilisation de Fabric Workspace Identity (WI) dans l'activité de bloc-notes

Créer l’identité de l’espace de travail

Vous devez activer WI dans votre espace de travail (cela peut prendre un moment de chargement). Créez une identité d’espace de travail dans votre espace de travail Fabric. Notez que le WI doit être créé dans le même espace de travail que votre Pipeline.

Consultez la documentation sur l’identité de l’espace de travail.
Activer les paramètres au niveau du locataire

Activez le paramètre de locataire suivant (il est désactivé par défaut): Les principaux de service peuvent appeler les API publiques de Fabric.

Vous pouvez activer ce paramètre dans le portail d’administration Fabric. Pour plus d’informations sur ce paramètre, consultez l’article Activer l’authentification du principal de service pour les API d’administration.
Accorder des autorisations d’espace de travail à l’identité de l’espace de travail

Ouvrez l’espace de travail, sélectionnez Gérer l’accès et attribuez des autorisations à l’identité de l’espace de travail. L’accès contributeur est suffisant pour la plupart des scénarios. Si votre bloc-notes n’est pas dans le même espace de travail que votre pipeline, vous devez attribuer au WI que vous avez créé dans l’espace de travail de votre pipeline, au moins l’accès Contributeur à l’espace de travail de votre bloc-notes.

Consultez la documentation sur Donner aux utilisateurs l’accès aux espaces de travail.

Définir la balise de session

Pour réduire le temps nécessaire à l’exécution de votre travail de bloc-notes, vous pourriez éventuellement définir une balise de session. La définition de la balise de session indique à Spark de réutiliser n’importe quelle session Spark existante, ce qui réduit le temps de démarrage. Toute valeur de chaîne arbitraire peut être utilisée pour la balise de session. Si aucune session n’existe, une nouvelle session est créée à l’aide de la valeur de balise.

Capture d’écran montrant l’onglet Paramètres du bloc-notes mettant en surbrillance l’onglet où il convient d’ajouter une balise de session.

Remarque

Pour pouvoir utiliser la balise de session, le mode haute concurrence pour le pipeline exécutant plusieurs blocs-notes doit être activé. Cette option se trouve sous le mode haute concurrence pour les paramètres Spark dans les paramètres de l’espace de travail

Enregistrer le pipeline, puis l'exécuter ou le planifier

Basculez vers l’onglet Accueil en haut de l’éditeur de pipeline et sélectionnez le bouton Enregistrer pour enregistrer votre pipeline. Sélectionnez Exécuter pour l’exécuter directement ou planifier des exécutions à des moments ou intervalles spécifiques. Pour plus d’informations sur les exécutions de pipeline, consultez : planifier des exécutions de pipeline.

Capture d'écran montrant l'onglet Accueil dans l'éditeur de pipeline avec le nom de l'onglet, les boutons Enregistrer, Exécuter et Planifier en surbrillance.

Après l’exécution, vous pouvez surveiller l’exécution du pipeline et afficher l’historique des exécutions à partir de l’onglet Sortie sous le canevas.

Problèmes connus

L’utilisation du principal de service pour exécuter un bloc-notes qui contient du code de liaison sémantique présente des limitations fonctionnelles et prend en charge uniquement un sous-ensemble de fonctionnalités de liaison sémantique. Pour plus d’informations, consultez les fonctions de liaison sémantique prises en charge . Pour utiliser d’autres fonctionnalités, il est recommandé de d’authentifier manuellement le lien sémantique avec une entité de service.

Guide pratique pour superviser les exécutions de pipelines

Commentaires

Cette page a-t-elle été utile ?

Last updated on 2026-04-07