Kommentar
Åtkomst till den här sidan kräver auktorisering. Du kan prova att logga in eller ändra kataloger.
Åtkomst till den här sidan kräver auktorisering. Du kan prova att ändra kataloger.
Den här sidan ger en översikt över hur du använder Databricks-till-Databricks OpenSharing för att dela data på ett säkert sätt med alla Databricks-användare, oavsett konto eller molnvärd, så länge användaren har åtkomst till en arbetsyta som är aktiverad för Unity Catalog.
Vem ska använda Databricks-to-Databricks OpenSharing?
Det finns tre sätt att dela data med hjälp av OpenSharing.
Databricks-till-Databricks-delningsprotokollet, som beskrivs i den här artikeln, kan du dela data från din Unity Catalog-aktiverade arbetsyta med användare som också har åtkomst till en Unity Catalog-aktiverad Databricks-arbetsyta.
Den här metoden använder OpenSharing-servern som är inbyggd i Azure Databricks och ger stöd för delning av notebook-filer, Datastyrning i Unity Catalog, granskning och användningsspårning för både leverantörer och mottagare. Integreringen med Unity Catalog förenklar konfigurationen och styrningen för både leverantörer och mottagare och förbättrar prestandan.
Med delningsprotokollet Databricks-to-Open kan du dela data som du hanterar på en Unity Catalog-aktiverad Databricks-arbetsyta med användare på alla databehandlingsplattformar.
Se Vad är delningsprotokollet OpenSharing Databricks-to-Open?.
Med en kundhanterad implementering av OpenSharing-servern med öppen källkod kan du dela från valfri plattform till valfri plattform, oavsett om det är Databricks eller inte.
En introduktion till OpenSharing och mer information om dessa tre metoder finns i Vad är OpenSharing?.
Databricks-till-Databricks OpenSharing-arbetsflöde
Det här avsnittet innehåller en översikt på hög nivå över databricks-till-Databricks-delningsarbetsflödet, med länkar till detaljerad dokumentation för varje steg.
I Databricks-to-Databricks OpenSharing-modellen:
En mottagare ger en dataleverantör den unika delningsidentifieraren för metaarkivet i Databricks Unity Catalog som är kopplat till Databricks-arbetsytan som mottagaren (som representerar en användare eller grupp av användare) använder för att få tillgång till de data som delas av dataleverantören.
Mer information finns i Steg 1: Begär mottagarens delningsidentifierare.
Dataprovidern skapar en andel i leverantörens Unity Catalog-metaarkiv. Det här namngivna objektet innehåller en samling tabeller, vyer, volymer och notebook-filer som registrerats i metaarkivet.
Mer information finns i Skapa resurser för OpenSharing.
Dataprovidern skapar ett mottagarobjekt i providerns Unity Catalog-metaarkiv. Det här namngivna objektet representerar den användare eller grupp av användare som kommer åt data som ingår i resursen, tillsammans med delningsidentifieraren för Unity Catalog-metaarkivet som är kopplat till arbetsytan som användaren eller gruppen av användare kommer att använda för att komma åt resursen. Delningsidentifieraren är nyckelidentifieraren som aktiverar den säkra anslutningen.
Mer information finns i Steg 2: Skapa mottagaren.
Dataleverantören ger mottagaren åtkomst till resursen.
Mer information finns i Hantera åtkomst till OpenSharing-dataresurser (för leverantörer).
Delningen blir tillgänglig i mottagarens Databricks-arbetsyta, och mottagaren kan komma åt den via Catalog Explorer, Databricks CLI eller SQL-kommandon i en Azure Databricks-notebook eller frågeredigeraren i Databricks SQL.
För att få åtkomst till tabeller, vyer, volymer och notebook-filer i en resurs måste en metaarkivadministratör eller privilegierad användare skapa en katalog från resursen. Sedan kan den användaren eller en annan användare som beviljas rätt behörighet ge andra användare åtkomst till katalogen och objekten i katalogen. Att bevilja behörigheter för delade kataloger och datatillgångar fungerar precis som med andra tillgångar som är registrerade i Unity Catalog, och den viktiga skillnaden är att användare endast kan beviljas läsåtkomst för objekt i kataloger som skapas från OpenSharing-resurser.
Delade notebook-filer finns på katalognivå och alla användare med
USE CATALOGbehörighet i katalogen kan komma åt dem.Mer information finns i Läs data som delas via Databricks-to-Databricks OpenSharing (för mottagare).
Förbättra tabellläsningsprestanda med historikdelning
Databricks-till-Databricks-tabellresurser kan förbättra prestanda genom att aktivera historikdelning. Delningshistoriken förbättrar prestandan genom att utnyttja tillfälliga säkerhetsautentiseringsuppgifter från din molnlagring, som är begränsad till rotkatalogen i providerns delade Delta-tabell, vilket resulterar i prestanda som är jämförbar med direkt åtkomst till källtabeller.
- För nya tabellresurser anger du
WITH HISTORYnär du skapar tabellresursen. Se Lägg till tabeller i en delning. När du delar en tabell med beräkning på Databricks Runtime 16.2 och senare ärWITH HISTORYstandardvärdet. - För befintliga tabellandelar måste du ändra andelen för att möjliggöra delning av tabellhistorik. Se Uppdatering aktier. När du delar en tabell med beräkning på Databricks Runtime 16.2 och senare är
WITH HISTORYstandardvärdet.
När du delar ett helt schema delas alla tabeller i schemat med historiken som standard.
Note
Tabeller med partitionering aktiverat får inte prestandafördelarna med historikdelning. Se Ange vilka tabellpartitioner som ska delas
Information om behörighetskrav för molntoken och överväganden för datasekretess finns i Behörighet för molntoken.
Databricks-till-Databricks-stödmatris för Open Sharing i molnmiljöer
Databricks-to-Databricks OpenSharing stöder delning inom samma miljötyp. Kommersiella moln omfattar arbetsytor med efterlevnadskontroller aktiverade, till exempel FedRAMP Moderate. Delning med Azure Government miljöer stöds inte.
Important
Delning mellan regulatoriska domäner är i en begränsad offentlig förhandsversion. Kontakta databricks-kontoteamet för att komma igång.
I den här matrisen representerar varje rad providermiljön (metaarkivets delningsdata) och varje kolumn representerar mottagarmiljön (metaarkivet som tar emot delade data).
| Leverantör | Mottagare: Kommersiella molntjänster | Mottagare: AWS GovCloud | Mottagare: AWS GovCloud DoD | Mottagare: Azure China |
|---|---|---|---|---|
| Kommersiella moln | ✓ | ✓ | ✓ | ✓ |
| AWS GovCloud | ✓ | ✓ | ✓ | |
| AWS GovCloud DoD | ✓ | ✓ | ✓ | |
| Azure Kina | ✓ | ✓ |
Limitations
Följande begränsningar gäller för delning av domäner mellan regler:
-
Cloud-token används såvida inte en delning flyttas in i eller ut ur AWS GovCloud eller AWS GovCloud DoD. I följande fall delas tabeller med försignerade URL:er i stället:
- Ett kommersiellt moln delar till eller tar emot resurser från antingen AWS GovCloud eller AWS GovCloud DoD.
- AWS GovCloud och AWS GovCloud DoD delar med varandra.