Partager via


Démarrage avec le flux d’invite

Cet article vous guide tout au long du parcours utilisateur principal visant à utiliser le flux d’invite dans Azure Machine Learning studio. Vous découvrez comment activer le flux d’invite dans votre espace de travail Azure Machine Learning, créer et développer un flux d’invite, tester et évaluer le flux, puis le déployer en production.

Prerequisites

Configurer une connexion

Une connexion permet de stocker et de gérer en toute sécurité les clés secrètes ou d’autres informations d’identification sensibles requises pour interagir avec les modèles de langage volumineux (LLM) et d’autres outils externes tels qu’Azure Content Safety. Les ressources de connexion sont partagées avec tous les membres de l’espace de travail.

Note

L'outil LLM dans le flux d'invite ne prend pas en charge les modèles de raisonnement (tels que OpenAI o1 ou o3). Pour l’intégration du modèle de raisonnement, utilisez l’outil Python pour appeler directement les API de modèle. Pour plus d’informations, consultez Appeler un modèle de raisonnement à partir de l’outil Python.

  1. Pour vérifier si vous disposez déjà d’une connexion Azure OpenAI, sélectionnez Flux d’invite dans le menu de gauche d’Azure Machine Learning Studio, puis sélectionnez l’onglet Connexions dans l’écran de flux d’invite .

    Capture d’écran de l’onglet Connexions avec le bouton Créer mis en évidence.

    Si vous voyez déjà une connexion dont le fournisseur est AzureOpenAI, vous pouvez ignorer le reste de ce processus d’installation. Notez que cette connexion doit avoir un déploiement pour pouvoir exécuter les nœuds LLM dans le flux d'exemple. Pour plus d’informations, consultez Déployer un modèle.

  2. Si vous n’avez pas de connexion Azure OpenAI, sélectionnez Créer , puis sélectionnez AzureOpenAI dans le menu déroulant.

  3. Dans le volet Ajouter une connexion Azure OpenAI , fournissez un nom pour la connexion, sélectionnez votre ID d’abonnement et le nom du compte Azure OpenAI, puis fournissez un mode d’authentification et des informations d’API.

    Le flux d’invite prend en charge la clé API ou l’authentification Microsoft Entra ID pour les ressources Azure OpenAI. Pour ce tutoriel, sélectionnez la clé API sous Mode d’authentification.

    Capture d’écran de l’écran de connexion Azure OpenAI.

    Pour obtenir les informations de l’API, accédez au terrain de jeu de conversation dans le portail Azure OpenAI et sélectionnez votre nom de ressource Azure OpenAI. Copiez la clé et collez-la dans le champ clé API dans le formulaire Ajouter une connexion Azure OpenAI, puis copiez le point de terminaison et collez-le dans le champ de base de l’API dans le formulaire.

    Capture d’écran du terrain de jeu de conversation montrant la clé et le point de terminaison d’une ressource Azure OpenAI.

    Pour plus d’informations sur l’authentification d’ID Microsoft Entra, consultez Comment configurer Azure OpenAI dans Microsoft Foundry Models avec l’authentification Microsoft Entra ID.

  4. Une fois que vous avez rempli tous les champs, sélectionnez Enregistrer pour créer la connexion.

  5. La connexion doit être associée à un déploiement avant de pouvoir exécuter les nœuds LLM dans le flux d'exemple. Pour créer le déploiement, consultez Déployer un modèle.

Créer et développer votre flux d’invite

Sous l’onglet Flux de la page d’accueil du flux d’invite , sélectionnez Créer pour créer le flux d’invite. La page Créer un flux affiche les types de flux que vous pouvez créer, des exemples intégrés que vous pouvez cloner pour créer un flux et des façons d’importer un flux.

Cloner à partir d’un exemple

Dans la galerie Explorer, vous pouvez parcourir les exemples intégrés et sélectionner Afficher les détails sur n’importe quelle vignette pour afficher un aperçu s’il convient à votre scénario.

Ce tutoriel utilise l’exemple de classification web pour parcourir le parcours utilisateur principal. La classification web est un flux illustrant la classification multiclasse avec un LLM. Étant donné une URL, le flux classe l'URL dans une catégorie Web avec seulement quelques clichés, un résumé simple et des invites de classification. Par exemple, en fonction d’une URL https://www.imdb.com, elle classifie l’URL en Movie.

Pour cloner l’exemple, sélectionnez Cloner sur la vignette Classification web .

Capture d’écran de la création depuis la galerie mettant en évidence la classification web.

Le volet Flux de clonage affiche l’emplacement où stocker votre flux dans le stockage de partage de fichiers de votre espace de travail. Vous pouvez personnaliser le dossier si vous le souhaitez. Sélectionnez Cloner.

Le flux cloné s’ouvre dans l’interface utilisateur de création. Vous pouvez sélectionner l’icône Modifier le crayon pour modifier les détails du flux, tels que le nom, la description et les balises.

Démarrer la session de calcul

Une session de calcul est nécessaire pour l’exécution du flux. La session de calcul gère les ressources informatiques nécessaires à l’exécution de l’application, y compris une image Docker qui contient tous les packages de dépendances nécessaires.

Dans la page de création de flux, démarrez une session de calcul en sélectionnant Démarrer la session de calcul.

Capture d’écran du démarrage de la session de calcul.

Inspecter la page de création de flux

La session de calcul peut prendre quelques minutes. Pendant le démarrage de la session de calcul, affichez les parties de la page de création de flux.

  • Le flux ou la vue aplatie sur le côté gauche de la page est la zone de travail principale, où vous pouvez créer le flux en ajoutant ou en supprimant des nœuds, en modifiant et en exécutant des nœuds en ligne, ou en modifiant des requêtes. Dans les sections Entrées et Sorties, vous pouvez afficher, ajouter/supprimer et modifier des entrées et des sorties.

    Lorsque vous avez cloné l’exemple de classification web actuel, les entrées et sorties ont déjà été définies. Le schéma d’entrée du flux est name: url; type: stringune URL de type chaîne. Vous pouvez remplacer manuellement la valeur d’entrée prédéfinie par une autre valeur.https://www.imdb.com

  • La section Fichiers en haut à droite affiche le dossier et la structure de fichiers du flux. Chaque dossier de flux contient un fichier flow.dag.yaml , des fichiers de code source et des dossiers système. Vous pouvez créer, charger ou télécharger des fichiers pour les tests, le déploiement ou la collaboration.

  • La vue Graph en bas à droite permet de visualiser à quoi ressemble le flux. Vous pouvez effectuer un zoom avant ou arrière, ou utiliser la disposition automatique.

Vous pouvez modifier des fichiers en ligne dans la vue Flux ou dans la vue aplatie, ou activer le mode brut et sélectionner un fichier dans Fichiers pour l'ouvrir dans un onglet et le modifier.

Capture d’écran de l’onglet de modification de fichier en mode de fichier brut.

Pour cet exemple, l’entrée est une URL à classifier. Le flux utilise un script Python pour extraire le contenu du texte à partir de l’URL, utilise LLM pour synthétiser le contenu du texte en 100 mots et classifie en fonction de l’URL et du contenu de texte résumé. Un script Python convertit ensuite la sortie LLM en dictionnaire. Le nœud prepare_examples alimente quelques exemples de captures à la requête du nœud de classification.

Configurer des nœuds LLM

Pour chaque nœud LLM, vous devez sélectionner une connexion pour définir les clés d’API LLM. Sélectionnez votre connexion Azure OpenAI.

Selon le type de connexion, vous devez sélectionner un deployment_name ou un modèle dans la liste déroulante. Pour une connexion Azure OpenAI, sélectionnez un déploiement. Si vous n’avez pas de déploiement, créez-en un dans le portail Azure OpenAI en suivant les instructions fournies dans Déployer un modèle.

Note

Si vous utilisez une connexion OpenAI plutôt qu’une connexion Azure OpenAI, vous devez sélectionner un modèle plutôt qu’un déploiement dans le champ Connexion .

Pour cet exemple, vérifiez que le type d’API est conversation, car l’exemple d’invite fourni est pour l’API de conversation. Pour plus d’informations sur la différence entre les API de conversation et d’achèvement, consultez Développer un flux.

Capture d’écran de la classification web montrant la liste déroulante de connexion.

Configurez les connexions pour les deux nœuds LLM dans le flux, summarize_text_content et classify_with_llm.

Exécuter un seul nœud

Pour tester et déboguer un nœud unique, sélectionnez l’icône Exécuter en haut d’un nœud dans la vue Flux . Vous pouvez développer les entrées et modifier l’URL d’entrée de flux pour tester le comportement du nœud pour différentes URL.

L'état d'exécution apparaît en haut du nœud. Une fois l’exécution terminée, la sortie d’exécution s’affiche dans la section Sortie du nœud.

Capture d’écran de l’exemple Classification web montrant l’exécution du nœud Python, la consultation de la sortie, l’exécution du nœud LLM, puis la consultation de la sortie.

La vue Graph affiche également l’état du nœud d’exécution unique.

Exécutez fetch_text_content_from_url , puis exécutez summarize_text_content pour vérifier si le flux peut récupérer du contenu à partir du web et résumer le contenu web.

Exécuter l’ensemble du flux

Pour tester et déboguer l’ensemble du flux, sélectionnez Exécuter en haut de l’écran. Vous pouvez modifier l’URL d’entrée de flux pour tester le comportement du flux pour différentes URL.

Capture d’écran de l’exemple Classification web montrant une exécution intégrale et mettant en évidence le bouton Exécuter.

Vérifiez l’état d’exécution et la sortie de chaque nœud.

Afficher les sorties de flux

Vous pouvez également définir des sorties de flux pour vérifier les sorties de plusieurs nœuds à un seul endroit. Les sorties de flux vous aident à :

  • Vérifiez les résultats des tests en bloc dans une table unique.
  • Définissez le mappage d’interface d’évaluation.
  • Définissez le schéma de réponse de déploiement.

Dans l'exemple cloné, les sorties de flux de catégorie et d'évidence sont déjà définies.

  1. Sélectionnez Afficher les sorties dans la bannière supérieure ou la barre de menus supérieure pour voir des informations détaillées sur les entrées, les sorties, l’exécution du flux et l’orchestration.

    Capture d’écran du bouton afficher la sortie dans deux emplacements.

  2. Sous l’onglet Sorties de l’écran Sorties , notez que le flux prédit l’URL d’entrée avec une catégorie et une preuve.

    Capture d’écran de l’affichage des sorties dans la page Sorties.

  3. Sélectionnez l’onglet Trace dans l’écran Sorties, puis sélectionnez Flux sous le nom du nœud pour afficher des informations détaillées sur la vue d’ensemble du flux dans le volet droit. Développez flux et sélectionnez une étape pour afficher des informations détaillées sur cette étape.

    Capture d’écran de l’écran Trace de flux.

Tester et évaluer

Une fois le flux exécuté avec succès avec une seule ligne de données, testez s’il fonctionne correctement avec un grand ensemble de données. Vous pouvez exécuter un test en bloc et éventuellement ajouter un flux d’évaluation, puis vérifier les résultats.

Vous devez commencer par préparer les données de test. Azure Machine Learning prend en charge les formats de fichiers CSV, TSV et JSONL pour les données.

  • Accédez à GitHub et téléchargez data.csv, le jeu de données d’or pour l’exemple de classification web.

Utilisez l'assistant d'exécution par lots et d'évaluation pour configurer et soumettre une exécution par lots et éventuellement une méthode d'évaluation. Les méthodes d’évaluation sont également des flux, qui utilisent Python ou LLM pour calculer des métriques telles que la précision et le score de pertinence.

  1. Sélectionnez Évaluer dans le menu supérieur de votre page de création de flux.

  2. Dans l’écran Paramètres de base, modifiez le nom d’affichage Exécuter si vous le souhaitez, ajoutez une description et des étiquettesd’exécution facultatives, puis sélectionnez Suivant.

  3. Dans l’écran paramètres d’exécution batch , sélectionnez Ajouter de nouvelles données. Dans l’écran Ajouter des données, indiquez un nom pour le jeu de données, sélectionnez Parcourir pour charger le fichier data.csv que vous avez téléchargé, puis sélectionnez Ajouter.

    Après avoir chargé les données ou si votre espace de travail dispose d’un autre jeu de données que vous souhaitez utiliser, recherchez et choisissez le jeu de données dans la liste déroulante pour afficher un aperçu des cinq premières lignes.

    La fonctionnalité de mappage d’entrée prend en charge le mappage de votre entrée de flux à une colonne de données de votre jeu de données, même si les noms de colonnes ne correspondent pas.

    Capture d’écran de l’Assistant d’exécution par lots et d’évaluation mettant en évidence l’option de chargement de nouvelles données.

  4. Sélectionnez Suivant pour sélectionner éventuellement une ou plusieurs méthodes d’évaluation. La page Sélectionner l’évaluation affiche les flux d’évaluation intégrés et personnalisés. Pour voir comment les métriques sont définies pour les méthodes d’évaluation intégrées, vous pouvez sélectionner plus de détails sur la vignette de la méthode.

    La classification web est un scénario de classification. Sélectionnez Évaluation de la précision de classification à utiliser pour l’évaluation, puis sélectionnez Suivant.

    Capture d’écran de l’exemple Classification web montrant l’Assistant d’exécution par lots et l’évaluation des méthodes d’évaluation.

  5. Dans l’écran Configurer l’évaluation, définissez le Mappage d’entrée d’évaluation pour tracer les valeurs de référence vers l’entrée de flux ${data.category} et tracez la prédiction vers la sortie de flux ${run.outputs.category}.

    Capture d’écran de l’exemple Classification web montrant l’Assistant d’exécution par lots et d’évaluation, section des paramètres d’évaluation.

  6. Sélectionnez Vérifier + envoyer , puis Envoyer pour envoyer une exécution de lot et la méthode d’évaluation sélectionnée.

Vérifier les résultats

Lorsque votre exécution est envoyée avec succès, sélectionnez Afficher la liste des exécutions pour afficher l’état de l’exécution sur la page Exécutions du flux d’invite. L’exécution par lots risque de prendre un certain temps. Vous pouvez sélectionner Actualiser pour charger l’état le plus récent.

Une fois l’exécution du lot terminée, sélectionnez la vérification en regard de l’exécution, puis sélectionnez Visualiser les sorties pour afficher le résultat de votre exécution par lot.

Capture d’écran de la sélection de la visualisation des sorties dans la page Exécutions.

Sur l’écran Visualiser les sorties, activez l’icône en forme d’œil à côté de l’exécution enfant pour ajouter des résultats d’évaluation au tableau des résultats de l’exécution par lots. Vous pouvez voir le nombre total de jetons et la précision globale. Le tableau Sortie affiche les résultats de chaque ligne de données : entrée, sortie de flux, métriques système et résultat d’évaluation correct ou incorrect.

Capture d’écran de la page des détails de l’exécution par lots de classification web pour voir les sorties.

Dans la table Sortie , vous pouvez :

  • Ajuster la largeur de colonne, masquer ou afficher les colonnes ou modifier l’ordre des colonnes.
  • Sélectionnez Exporter pour télécharger la page active en tant que fichier CSV ou Télécharger un script d’exportation de données en tant que fichier jupyter notebook que vous pouvez exécuter pour télécharger des sorties localement.
  • Sélectionnez l’icône Afficher les détails en regard de n’importe quelle ligne pour ouvrir la vue Trace affichant les détails complets de cette ligne.

La précision n’est pas la seule métrique qui peut évaluer une tâche de classification. Par exemple, vous pouvez également utiliser le rappel pour évaluer. Pour exécuter d'autres évaluations, sélectionnez Évaluer à côté de Visualiser les sorties sur la page Exécution puis sélectionnez d'autres méthodes d'évaluation.

Déployer en tant que point de terminaison

Après avoir généré et testé un flux, vous pouvez le déployer en tant que point de terminaison afin de pouvoir appeler le point de terminaison pour l’inférence en temps réel.

Configurer le point de terminaison

  1. Dans la page Exécutions par lots, sélectionnez le lien du nom d’exécution, puis, dans la page détails de l’exécution, sélectionnez Déployer dans la barre de menus supérieure pour ouvrir l’Assistant Déploiement.

  2. Dans la page Paramètres de base , spécifiez un nom de point de terminaison et un nom de déploiement , puis sélectionnez un type de machine virtuelle et un nombre d’instances.

  3. Vous pouvez sélectionner Suivant pour configurer les paramètres avancés de point de terminaison, de déploiement et de sorties et de connexions . Pour cet exemple, utilisez les paramètres par défaut.

  4. Sélectionnez Vérifier + Créer , puis créer pour démarrer le déploiement.

Tester le point de terminaison

Vous pouvez accéder à votre page de détails de point de terminaison à partir de la notification, ou en sélectionnant Points de terminaison dans le volet de navigation de gauche de Studio et en sélectionnant votre point de terminaison sous l’onglet Points de terminaison en temps réel . Le déploiement du point de terminaison prend plusieurs minutes. Une fois le point de terminaison déployé, vous pouvez le tester sous l’onglet Test .

Placez l’URL à tester dans la zone d’entrée, puis sélectionnez Test. Vous voyez le résultat prédit par votre point de terminaison.

Nettoyer les ressources

Pour conserver les ressources de calcul et les coûts, vous pouvez arrêter votre session de calcul si vous avez terminé de l’utiliser pour l’instant. Sélectionnez la session en cours d’exécution, puis arrêtez la session de calcul.

Vous pouvez également arrêter une instance de calcul en sélectionnant Calcul à partir du volet de navigation de gauche de Studio, en sélectionnant votre instance de calcul dans la liste des instances de calcul, puis en sélectionnant Arrêter.

Si vous n’envisagez pas d’utiliser les ressources que vous avez créées dans ce didacticiel, vous pouvez les supprimer afin qu’elles n’entraînent pas de frais. Depuis le portail Azure, recherchez et sélectionnez Groupes de ressources. Dans la liste, sélectionnez le groupe de ressources qui contient les ressources que vous avez créées, puis sélectionnez Supprimer le groupe de ressources dans le menu supérieur de la page du groupe de ressources.