Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Op deze pagina wordt uitgelegd hoe u de serverloze omgeving configureert voor notebooks en taaktaken. Gebruik voor notebooks het deelvenster Omgeving om een basisomgeving te selecteren, afhankelijkheden te installeren, geheugen te configureren en gebruiksbeleid toe te passen. Voor taaktaken configureert u de omgeving wanneer u een taak maakt of bewerkt.
Als u het zijvenster Omgeving wilt uitvouwen, klikt u op de
rechts van het notitieblok.
Een basisomgeving selecteren
Een basisomgeving bepaalt de vooraf geïnstalleerde bibliotheken en omgevingsversie die beschikbaar is voor uw serverloze notebook. De basisomgevingselector in het deelvenster Omgevingszijde is de locatie waar u uw omgeving kiest. Zie Serverloze omgevingsversies voor meer informatie over elke omgevingsversie. Databricks adviseert de nieuwste versie te gebruiken om gebruik te maken van de meest actuele notebookfuncties.
De basisomgevingkiezer bevat de volgende opties:
- Standaard: de standaardserverloze basisomgeving met door Databricks geleverde bibliotheken.
- ML (Beta): Een basisomgeving met de Python- en systeempakketten van Databricks Runtime voor Machine Learning vooraf geïnstalleerd. Gebruik deze omgeving om klassieke Databricks Runtime te migreren voor Machine Learning workloads naar serverloze berekeningen. Zie de ML-basisomgeving.
- AI: Een voor AI geoptimaliseerde basisomgeving met vooraf geïnstalleerde ML-bibliotheken (Machine Learning). Deze optie wordt alleen weergegeven wanneer een accelerator (GPU) is geselecteerd.
-
Meer: Uitvouwen om extra opties weer te geven:
- Vorige versies van Standard-, ML- en AI-omgevingen.
- Aangepast: Geef een aangepaste omgeving op met behulp van een YAML-bestand.
- Werkruimteomgevingen: geeft een lijst weer van alle compatibele basisomgevingen die zijn geconfigureerd voor uw werkruimte door een beheerder.
Een basisomgeving selecteren:
- Klik in de gebruikersinterface van het notitieblok op het zijvenster Omgeving
. - Selecteer onder Basisomgeving een omgeving in de vervolgkeuzelijst.
- Klik op Toepassen.
Afhankelijkheden toevoegen aan het notebook
Omdat serverloos geen ondersteuning biedt voor rekenbeleid of init-scripts, moet u aangepaste afhankelijkheden installeren met behulp van het deelvenster Omgevingszijde . U kunt afhankelijkheden afzonderlijk installeren of een deelbare basisomgeving gebruiken om meerdere afhankelijkheden te installeren.
Azure Databricks slaat de virtuele omgeving van uw notebook op in de cache, zodat afhankelijkheden niet telkens opnieuw worden geïnstalleerd wanneer u een notebook opnieuw opent of weer verdergaat na inactiviteit. Taaktaken die dezelfde afhankelijkheidsset delen, profiteren ook van deze cache binnen een uitvoering.
Een afhankelijkheid afzonderlijk installeren:
Klik in de notebookinterface op het zijvenster Omgeving
.Klik in de sectie Afhankelijkheden op Afhankelijkheid toevoegen en voer het pad in van de afhankelijkheid in het veld. U kunt een afhankelijkheid opgeven in elke indeling die geldig is in een requirements.txt-bestand . Python wielen of Python projecten (bijvoorbeeld de map met een
pyproject.tomlof eensetup.py) kunnen zich bevinden in de werkruimtebestanden of de Unity Catalog-volumes.- Als u een werkruimtebestand gebruikt, moet het pad absoluut zijn en beginnen met
/Workspace/. - Als u een bestand in een Unity Catalog-volume gebruikt, moet het pad de volgende indeling hebben:
/Volumes/<catalog>/<schema>/<volume>/<path>.whl
- Als u een werkruimtebestand gebruikt, moet het pad absoluut zijn en beginnen met
Klik op Apply om de afhankelijkheden te installeren en het Python proces opnieuw te starten.
Important
Installeer niet PySpark of een bibliotheek die PySpark als afhankelijkheid installeert op uw serverloze notebooks. Als u dit doet, wordt uw sessie gestopt en resulteert dit in een fout. Als dit gebeurt, verwijdert u de bibliotheek en u de omgeving opnieuw instelt.
Als u geïnstalleerde afhankelijkheden wilt weergeven, klikt u op het tabblad Geïnstalleerd in het zijvenster Omgevingen . Open de pip-installatielogboeken voor de notebookomgeving door onderaan het deelvenster op pip-logboeken te klikken.
Note
Werkruimtebeheerders kunnen privé- of geverifieerde pakketopslagplaatsen configureren als standaard pip-bron voor serverloze notebooks en taken. Hiermee kunnen gebruikers pakketten installeren vanuit interne repositories zonder index-url of extra-index-url op te geven. Zie Standaardpakketopslagplaatsen voor Python configureren.
Een aangepaste omgevingsspecificatie maken
U kunt aangepaste omgevingsspecificaties maken en opnieuw gebruiken.
- Selecteer in een serverloze notebook een basisomgeving en installeer de gewenste afhankelijkheden.
- Klik op de knop voor het kebabmenu
onder aan het deelvenster Omgeving en klik vervolgens op Omgeving exporteren.
- Sla de specificatie op als een werkruimtebestand of in een Unity Catalog-volume.
Als u uw aangepaste omgevingsspecificatie in een notebook wilt gebruiken, selecteert u Aangepast in het vervolgkeuzemenu Basisomgeving en gebruikt u vervolgens het om uw YAML-bestand te selecteren.
Algemene hulpprogramma's maken om te delen in uw werkruimte
In dit voorbeeld wordt een hulpprogramma opgeslagen in een werkruimtebestand en geïnstalleerd als een serverloze notebookafhankelijkheid:
Maak een map met de volgende structuur. Zorg ervoor dat andere gebruikers leestoegang hebben tot dit pad:
helper_utils/ ├── helpers/ │ └── __init__.py # your common functions live here ├── pyproject.tomlVul als volgt in
pyproject.toml:[project] name = "common_utils" version = "0.1.0"Voeg een functie toe aan het
init.pybestand. Voorbeeld:def greet(name: str) -> str: return f"Hello, {name}!"Klik in de gebruikersinterface van het notebook op het zijvenster Omgeving
Klik in de sectie Afhankelijkheden op Afhankelijkheid toevoegen en voer vervolgens het pad van uw hulpprogrammabestand in. Voorbeeld:
/Workspace/helper_utils.Klik op Toepassen.
U kunt nu de functie in uw notebook gebruiken:
from helpers import greet
print(greet('world'))
Dit wordt uitgevoerd als:
Hello, world!
AI Runtime gebruiken (serverloze GPU)
Important
AI Runtime bevindt zich in openbare preview.
Volg deze stappen om AI Runtime te configureren, mogelijk gemaakt door serverloze GPU-rekenkracht, in uw Azure Databricks notebook:
- Klik in een notebook op de vervolgkeuzelijst compute bovenaan en selecteer serverloze GPU.
- Klik op het
het deelvenster Omgeving te openen.
- Selecteer A10 in het veld Accelerator .
- Selecteer onder BasisomgevingStandard voor de standaardomgeving of AI voor de door AI geoptimaliseerde omgeving met vooraf geïnstalleerde ML-bibliotheken (Machine Learning).
- Klik op Toepassenen bevestig vervolgens dat u AI Runtime wilt toepassen op uw notebookomgeving.
Zie AI Runtime voor meer informatie.
Serverloze rekenkracht met hoog geheugen gebruiken
Important
Deze functie bevindt zich in openbare preview-versie.
Als u in uw notebook fouten door geheugentekort tegenkomt, configureer het notebook dan zo dat het meer geheugen gebruikt. Deze instelling voor geheugengrootte verhoogt de grootte van het REPL-geheugen dat wordt gebruikt bij het uitvoeren van code in het notebook. Dit heeft geen invloed op de geheugengrootte van de Spark-sessie. Serverloos gebruik met hoog geheugen heeft een hogere DBU-emissiesnelheid dan standaardgeheugen.
De beschikbare geheugenopties zijn:
- Standaard: 16 GB totaal geheugen.
- Hoog: 32 GB totaal geheugen.
Volg de volgende stappen om de geheugeninstelling van het notitieblok te configureren:
- Klik in de gebruikersinterface van het notebook op het zijvenster Environment
. - Onder Geheugen, selecteer Hoog geheugen.
- Klik op Toepassen.
Deze geheugeninstelling is ook van toepassing op notebooktaaktaken die worden uitgevoerd met behulp van de geheugenvoorkeuren van het notebook. Het bijwerken van de geheugenvoorkeur in het notebook is van invloed op de volgende taakuitvoering.
Een serverloos gebruiksbeleid selecteren
Important
Deze functie bevindt zich in openbare preview-versie.
Met serverloos gebruiksbeleid kan uw organisatie aangepaste tags toepassen op serverloos gebruik voor gedetailleerde factureringsvermelding.
Als uw werkruimte gebruikmaakt van serverloos gebruiksbeleid, selecteert u het beleid dat u op het notebook wilt toepassen. Als een gebruiker is toegewezen aan slechts één serverloos gebruiksbeleid, is dat beleid standaard van toepassing.
Nadat u verbinding hebt gemaakt met serverloze berekeningen, selecteert u een beleid in het deelvenster Omgevingszijde :
- Klik in de gebruikersinterface van het notitieblok op het zijvenster Omgeving
. - Selecteer onder Serverloos gebruiksbeleid het serverloze gebruiksbeleid dat u wilt toepassen op uw notitieblok.
- Klik op Toepassen.
Nadat het beleid is toegepast, neemt al het notebookgebruik de aangepaste tags van het beleid over.
Note
Als uw notebook afkomstig is van een Git-opslagplaats of geen toegewezen beleid voor serverloos gebruik heeft, wordt het standaard ingesteld op het laatst gekozen serverloze gebruiksbeleid wanneer het naast serverloze rekenproces wordt gekoppeld.
De omgeving opnemen in de export van bronbestanden
Voor Python notebooks kunt u Include in het exporteren van bronbestanden inschakelen in de omgevingsconfiguratie. Wanneer deze functie is ingeschakeld, worden de basis-omgeving en afhankelijkheden opgeslagen in de indeling PEP 723 in bronbestandsexporten. Hierdoor blijft de omgevingsconfiguratie behouden wanneer notebooks worden opgeslagen in Git-mappen of worden gedownload als bronbestanden.
Een notebook met Standard v5 exporteert bijvoorbeeld de omgevingsconfiguratie als inlinemetagegevens boven aan het bestand:
# Databricks notebook source
# /// script
# [tool.databricks.environment]
# environment_version = "5"
# ///
print("Hello World!")
De omgevingsafhankelijkheden opnieuw instellen
Als uw notebook is verbonden met serverloze berekeningen, slaat Databricks automatisch de inhoud van de virtuele omgeving van het notebook in de cache op. Dit betekent dat u in het algemeen de Python afhankelijkheden die zijn opgegeven in het deelvenster Omgeving niet opnieuw hoeft te installeren wanneer u een bestaand notitieblok opent, zelfs niet als de verbinding is verbroken vanwege inactiviteit.
Python cacheopslag van virtuele omgevingen is ook van toepassing op taken. Wanneer een taak wordt uitgevoerd, wordt elke taak die dezelfde set afhankelijkheden deelt als een voltooide taak in dezelfde uitvoering sneller voltooid, omdat de cache al de vereiste afhankelijkheden bevat.
Note
Als u de implementatie van een aangepast Python pakket wijzigt dat wordt gebruikt in een taak zonder server, moet u ook het versienummer bijwerken, zodat taken de meest recente implementatie kunnen ophalen.
Als u de omgevingscache wilt wissen en een nieuwe installatie wilt uitvoeren van de afhankelijkheden die zijn opgegeven in het deelvenster Omgeving van een notebook dat is gekoppeld aan serverloze berekening, klikt u op de pijl naast Toepassen en klikt u vervolgens op Standaardwaarden herstellen.
Als u pakketten installeert die het kernnotebook of de Apache Spark-omgeving verbreken of wijzigen, verwijdert u de offending-pakketten en stelt u de omgeving opnieuw in. Bij het starten van een nieuwe sessie wordt de hele omgevingscache niet gewist.
Omgeving configureren voor taaktaken
Elke taaktaak wordt uitgevoerd in een geïsoleerde omgeving met een basisomgeving en eventuele extra bibliotheken die u opgeeft. De basisomgeving stelt de Python- en Scala-runtimeversie en vooraf geïnstalleerde bibliotheken in. Taken nemen de standaardset geïnstalleerde bibliotheken over van de omgevingsversie. Om te zien wat is inbegrepen, raadpleegt u de sectie Installed Python libraries of Installed Java and Scala libraries in de omgevingsversie die u gebruikt.
U kunt de vooraf geïnstalleerde bibliotheken aanvullen met bibliotheken uit werkruimtebestanden, Unity Catalog-volumes of openbare pakketopslagplaatsen. Alleen afhankelijkheden die vereist zijn voor de taak, worden tijdens runtime geïnstalleerd.
Important
Het gebruik van serverloze rekenkracht voor JAR-taken bevindt zich in openbare preview.
Important
Het selecteren van een beheerde basisomgeving bevindt zich in de bètaversie. Met de vervolgkeuzelijst Basisomgeving in het dialoogvenster Omgeving configureren kunt u kiezen uit door Databricks geleverde omgevingen (zoals Standard en ML) of door de werkruimte geconfigureerde omgevingen. Zonder deze functie toont het dialoogvenster in plaats daarvan de vervolgkeuzelijst Omgevingsversie. Werkruimtebeheerders kunnen deze functie inschakelen vanaf de pagina Previews .
De omgeving configureren op taaktype
Hoe u omgevingen in een taak configureert, is afhankelijk van het taaktype:
Notebook-taken
Notebook-taken zijn standaard ingesteld op Notebook Environment, die gebruikmaakt van de eigen geconfigureerde basisomgeving en afhankelijkheden van het notebook. U kunt dit negeren met een omgevingsvariabele op taakniveau.
Een omgeving op taakniveau configureren:
- Klik in de taakconfiguratie op de vervolgkeuzelijst Omgeving en bibliotheken .
- Klik in de takenomgeving op het potloodpictogram naast Standaard of klik op + Nieuwe takenomgeving toevoegen.
- Selecteer in het dialoogvenster Omgeving configureren de optie in de vervolgkeuzelijst Basisomgeving :
- Databricks-omgevingen: Azure Databricks beschikbare opties, zoals Standard en ML.
- Werkruimteomgevingen: aangepaste omgevingen die zijn geconfigureerd door uw werkruimtebeheerder. Zie Basisomgevingen voor werkruimten beheren.
- Meer: Vorige versies en Aangepast (geef een YAML-bestand op).
- Voeg onder Afhankelijkheden eventuele extra bibliotheken toe. U kunt een bibliotheek opgeven in elke indeling die geldig is voor een requirements.txt-bestand, of een absoluut pad naar een bestand in de werkruimte of een Unity Catalog-volume gebruiken.
- Klik op Bevestigen.
Note
Als voor uw werkruimte de preview van de basisomgeving voor taken niet is ingeschakeld, wordt in het dialoogvenster Omgeving configureren de vervolgkeuzelijst Omgevingsversie weergegeven in plaats van Basisomgeving.
Als u de omgeving wilt configureren, selecteert u een versie en klikt u vervolgens op + Bibliotheek toevoegen. U kunt een pad naar een werkruimtebestand opgeven (te beginnen met /Workspace/), een Unity Catalog-volumepad (te beginnen met /Volumes/) of een verwijzing naar het vereistenbestand (bijvoorbeeld -r /Workspace/path/to/requirements.txt).
Python script- en Python wieltaken
voor Python script- en Python wieltaken moet een omgeving worden geconfigureerd.
- Klik in de taakconfiguratie onder Omgeving en bibliotheken op + Afhankelijkheid toevoegen.
- Selecteer in het dialoogvenster Omgeving configureren de optie in de vervolgkeuzelijst Basisomgeving :
- Databricks-omgevingen: Azure Databricks beschikbare opties, zoals Standard en ML.
- Werkruimteomgevingen: aangepaste omgevingen die zijn geconfigureerd door uw werkruimtebeheerder. Zie Basisomgevingen voor werkruimten beheren.
- Meer: Vorige versies en Aangepast (geef een YAML-bestand op).
- Voeg onder Afhankelijkheden eventuele extra bibliotheken toe.
- Klik op Bevestigen.
Note
Als in uw werkruimte de preview van de basisomgeving van de werkruimte voor taken niet is ingeschakeld, wordt in het dialoogvenster Omgeving configureren het vervolgkeuzemenu Omgevingsversie weergegeven in plaats van Basisomgeving.
Als u de omgeving wilt configureren, selecteert u een versie en klikt u vervolgens op + Bibliotheek toevoegen. U kunt een pad naar een werkruimtebestand opgeven (te beginnen met /Workspace/), een Unity Catalog-volumepad (te beginnen met /Volumes/) of een verwijzing naar het vereistenbestand (bijvoorbeeld -r /Workspace/path/to/requirements.txt).
Dbt-taken
DBT-taken maken gebruik van een omgeving op taakniveau voor bibliotheekconfiguratie.
Een omgeving op taakniveau configureren:
- Klik in de taakconfiguratie op de vervolgkeuzelijst Omgeving en bibliotheken .
- Klik in de takenomgeving op het potloodpictogram naast een bestaande omgeving of klik op + Nieuwe takenomgeving toevoegen.
- Selecteer in het dialoogvenster Omgeving configureren de optie in de vervolgkeuzelijst Basisomgeving :
- Databricks-omgevingen: Azure Databricks beschikbare opties, zoals Standard en ML.
- Werkruimteomgevingen: aangepaste omgevingen die zijn geconfigureerd door uw werkruimtebeheerder. Zie Basisomgevingen voor werkruimten beheren.
- Meer: Vorige versies en Aangepast (geef een YAML-bestand op).
- Voeg onder Afhankelijkheden eventuele extra bibliotheken toe. U kunt een bibliotheek opgeven in elke indeling die geldig is voor een requirements.txt-bestand, of een absoluut pad naar een bestand in de werkruimte of een Unity Catalog-volume gebruiken.
- Klik op Bevestigen.
Note
Als in uw werkruimte de preview van de basisomgeving van de werkruimte voor taken niet is ingeschakeld, wordt in het dialoogvenster Omgeving configureren het vervolgkeuzemenu Omgevingsversie weergegeven in plaats van Basisomgeving.
Als u de omgeving wilt configureren, selecteert u een versie en klikt u vervolgens op + Bibliotheek toevoegen. U kunt een pad naar een werkruimtebestand opgeven (te beginnen met /Workspace/), een Unity Catalog-volumepad (te beginnen met /Volumes/) of een verwijzing naar het vereistenbestand (bijvoorbeeld -r /Workspace/path/to/requirements.txt).
JAR-taken
Basisomgevingen voor werkruimten worden niet ondersteund voor JAR-taken. De omgeving voor een JAR-taak configureren:
- Klik in de taakconfiguratie onder Omgeving en bibliotheken op + JAR-afhankelijkheid toevoegen.
- In het dialoogvenster Omgeving configureren :
- Voer desgewenst een pad in naar een YAML-bestand in het veld Basisomgeving .
- Selecteer een omgevingsversie in de vervolgkeuzelijst Omgevingsversie .
- Voeg onder JAR-afhankelijkheden de paden toe aan uw JAR-bestanden.
- Klik op Bevestigen.
Zie Een aangepaste omgevingsspecificatie maken om een aangepaste, op YAML gebaseerde basisomgeving te maken.
Omgevings- en rekencompatibiliteit
De basisomgeving die u selecteert, moet compatibel zijn met het rekentype van de taak. Een omgeving die is gebouwd voor GPU-rekenkracht is bijvoorbeeld niet compatibel met CPU-rekenkracht. In de takeninterface zijn incompatibele omgevingen niet beschikbaar in het vervolgkeuzemenu voor de basisomgeving.
Wanneer u een notebooktaak configureert, kunnen het rekentype (CPU of GPU) en de basisomgeving elk afkomstig zijn van de taakinstellingen of de notebookinstellingen.
- Als u een hardwareversneller (GPU) instelt op taakniveau, moet u ook een basisomgeving op taakniveau selecteren. U kunt de notebookomgeving niet gebruiken met een accelerator op taakniveau.
- Als u taken hebt die verwijzen naar een notebook en u het computetype van het notebook waarnaar wordt verwezen bijwerkt (bijvoorbeeld van CPU naar GPU), kunnen bestaande taken incompatibel worden met hun geconfigureerde omgeving. Controleer de omgevingsinstellingen van uw taak nadat u de rekenconfiguratie van het notebook hebt gewijzigd.
- Voor API-gebruikers: als u de basisomgeving op taakniveau instelt, maar het compute-type in het notebook is gedefinieerd, valideert Azure Databricks de compatibiliteit tijdens de uitvoering, niet wanneer de taak wordt gemaakt. Als de configuratie niet compatibel is, mislukt de uitvoering met een fout.