Vad är OpenSharing?

Den här sidan introducerar OpenSharing i Azure Databricks, den säkra datadelningsplattform som gör att du kan dela data och AI-tillgångar i Azure Databricks med användare utanför organisationen, oavsett om de använder Azure Databricks. OpenSharing är också grunden för Databricks Marketplace, ett öppet forum för utbyte av dataprodukter och Clean Rooms, en säker och sekretessskyddande miljö där flera parter kan arbeta tillsammans med känsliga företagsdata.

OpenSharing är också tillgängligt som ett projekt med öppen källkod som du kan använda för att dela Delta-tabeller från andra plattformar.

Hur fungerar OpenSharing?

OpenSharing är ett öppet protokoll som utvecklats av Databricks för säker datadelning med andra organisationer. Det fungerar oavsett de beräkningsplattformar som dessa organisationer använder.

Det finns några sätt att dela data med Hjälp av OpenSharing:

  1. Delningsprotokollet Databricks-till-Databricks, som gör att du kan dela data och AI-tillgångar från din Unity Catalog-aktiverade arbetsyta med användare som också har åtkomst till en Unity Catalog-aktiverad Databricks-arbetsyta.

    Den här metoden använder OpenSharing-servern som är inbyggd i Azure Databricks. Den stöder vissa OpenSharing-funktioner som inte stöds i de andra protokollen, inklusive delning av notebook-filer, volymdelning i Unity Catalog, Ai-modelldelning i Unity Catalog, datastyrning i Unity Catalog, granskning och användningsspårning för både leverantörer och mottagare. Integreringen med Unity Catalog förenklar konfigurationen och styrningen för både leverantörer och mottagare och förbättrar prestandan.

    Se Vad är OpenSharing Databricks-to-Databricks-protokollet?.

  2. Delningsprotokollet Databricks-to-Open, som gör att du kan dela tabelldata som du hanterar i en Unity Catalog-aktiverad Databricks-arbetsyta med användare på alla beräkningsplattformar.

    Den här metoden använder OpenSharing-servern som är inbyggd i Azure Databricks och är användbar när du hanterar data med Unity Catalog och vill dela dem med användare som inte använder Databricks eller inte har åtkomst till en Unity Catalog-aktiverad Databricks-arbetsyta. Integreringen med Unity Catalog på providersidan förenklar konfigurationen och styrningen för leverantörer.

    Se Vad är delningsprotokollet OpenSharing Databricks-to-Open?.

  3. En kundhanterad implementering av OpenSharing-servern med öppen källkod, som gör att du kan dela från valfri plattform till valfri plattform, oavsett om det är Databricks eller inte.

    Dokumentationen Azure Databricks omfattar inte instruktioner för att konfigurera en egen OpenSharing-server. Se projektet open-source.

  4. SAP Business Data Cloud(BDC) Connector för Azure Databricks, vilket gör att du kan dela data mellan din Unity Catalog-aktiverade arbetsyta och ett SAP BDC-konto.

    Den här metoden använder SAP BDC Connector, som använder OpenSharing för direkt åtkomst utan kopiering till SAP BDC-dataprodukter.

    Se Vad är SAP BDC Connector för Azure Databricks?.

Resurser, leverantörer och mottagare

De främsta begreppen bakom OpenSharing i Azure Databricks är resurser, leverantörer och mottagare.

Vad är en aktie?

I OpenSharing är en resurs en skrivskyddad samling tabeller och tabellpartitioner som en provider vill dela med en eller flera mottagare. Om mottagaren använder en Unity Catalog-aktiverad Databricks-arbetsyta kan du även inkludera notebook-filer, vyer (inklusive dynamiska vyer som begränsar åtkomsten på rad- och kolumnnivå), Unity Catalog-volymer och Unity Catalog-modeller i en resurs.

Du kan lägga till eller ta bort tabeller, strömmande tabeller, hanterade Iceberg-tabeller, vyer, materialiserade vyer, volymer, modeller och notebook-filer från en resurs när som helst, och du kan när som helst tilldela eller återkalla datamottagarens åtkomst till en resurs.

I en Unity Catalog-aktiverad Azure Databricks-arbetsyta är en "share" ett säkerhetsklassat objekt som registrerats i Unity Catalog. Om du tar bort en delning från ditt Unity Catalog-metaarkiv förlorar alla mottagare av den delning möjligheten att komma åt den.

Se Skapa resurser för OpenSharing.

Vad är en leverantör?

En provider är en entitet som delar data med en mottagare. Om du är en provider och vill dra nytta av den inbyggda Databricks OpenSharing-servern och hantera resurser och mottagare med hjälp av Unity Catalog behöver du minst en Azure Databricks arbetsyta som är aktiverad för Unity Catalog. Du behöver inte migrera alla dina befintliga arbetsytor till Unity Catalog. Du kan helt enkelt skapa en ny Unity Catalog-aktiverad arbetsyta för dina OpenSharing-behov.

Om en mottagare finns på en Unity Catalog-aktiverad Databricks-arbetsyta är leverantören också ett Unity Catalog-skyddsbart objekt som representerar leverantörsorganisationen och associerar organisationen med en uppsättning andelar.

Vad är en mottagare?

En mottagare är en entitet som tar emot resurser från en provider. I Unity Catalog är en resurs ett skyddsbart objekt som representerar en organisation och associerar den med en identifierare för autentiseringsuppgifter eller säker delning som gör att organisationen kan komma åt en eller flera resurser.

Som dataleverantör (delare) kan du definiera flera mottagare för ett visst Unity Catalog-metaarkiv, men om du vill dela data från flera metaarkiv med en viss användare eller grupp av användare måste mottagaren definieras separat för varje metaarkiv. En mottagare kan ha åtkomst till flera delningar.

Om en provider tar bort en mottagare från deras Unity Catalog-metaarkiv förlorar mottagaren åtkomst till alla resurser som den tidigare kunde komma åt.

Se Skapa datamottagare för OpenSharing (Databricks-till-Databricks-delning).

Databricks-to-Open-delning jämfört med Databricks-till-Databricks-delning

I det här avsnittet beskrivs de två protokollen för delning från en Databricks-arbetsyta som är aktiverad för Unity Catalog.

Note

Det här avsnittet förutsätter att providern finns på en Unity Catalog-aktiverad Azure Databricks-arbetsyta. Mer information om hur du konfigurerar en OpenSharing-server med öppen källkod att dela från en icke-Databricks-plattform eller en arbetsyta som inte är en Unity Catalog-arbetsyta finns i open-source projektet.

Hur en provider använder OpenSharing i Azure Databricks beror på vem de delar data med:

  • Med öppen delning kan du dela data med alla användare, oavsett om de har åtkomst till Azure Databricks eller inte.
  • Databricks-to-Databricks-delning gör att du kan dela data med Azure Databricks-användare vars arbetsyta är kopplad till ett Unity Catalog-metastore som skiljer sig från ditt. Databricks-to-Databricks har också stöd för delning av notebook-filer, volymer och modeller, vilket inte är tillgängligt i Databricks-to-Open-delning.

Vad är open OpenSharing?

Om du vill dela data med användare utanför din Azure Databricks arbetsyta, oavsett om de använder Databricks, kan du använda open OpenSharing för att dela dina data på ett säkert sätt. Som dataprovider hanterar du autentisering med delningsmottagaren med någon av följande metoder:

  • Du genererar en långlivad bärartoken och delar den säkert med mottagaren. De använder token för att autentisera och få läsåtkomst till de tabeller som du har inkluderat i de resurser som du har gett dem åtkomst till.
  • Du använder OIDC-federation (Open ID Connect) och beviljar kortlivade Databricks OAuth-token till mottagaren i utbyte mot JWT-token som mottagarens identitetsprovider (IdP) skickar till Databricks.

Mottagarna kan komma åt delade data med hjälp av många beräkningsverktyg och plattformar, bland annat:

  • Azure Databricks
  • Apache Spark
  • Pandas
  • Power BI

En fullständig lista över OpenSharing-anslutningsappar och information om hur du använder dem finns i OpenSharing-dokumentationen .

Se även Vad är delningsprotokollet OpenSharing Databricks-to-Open?.

Vad är Databricks-to-Databricks OpenSharing?

Om du vill dela data med användare som har en Databricks-arbetsyta som är aktiverad för Unity Catalog kan du använda Databricks-till-Databricks OpenSharing. Med Databricks-till-Databricks-delning kan du dela data med användare i andra Databricks-konton, oavsett om de är på AWS, Azure eller GCP. Det är också ett bra sätt att på ett säkert sätt dela data över olika Unity Catalog-metaarkiv i ditt eget Databricks-konto. Observera att du inte behöver använda OpenSharing för att dela data mellan arbetsytor som är kopplade till samma Unity Catalog-metaarkiv, eftersom du i det scenariot kan använda Unity Catalog själv för att hantera åtkomst till data mellan arbetsytor.

En fördel med Databricks-till-Databricks-delning är att resursmottagaren inte behöver en token för att komma åt resursen och att providern inte behöver hantera mottagartoken. Säkerheten för delningsanslutningen – inklusive all identitetsverifiering, autentisering och granskning – hanteras helt via OpenSharing och Databricks-plattformen. En annan fördel är möjligheten att dela Databricks Notebook-filer, Unity Catalog-volymer och Unity Catalog-modeller.

Se även Vad är OpenSharing Databricks-to-Databricks-protokollet?.

Hur konfigurerar provideradministratörer OpenSharing?

Det här avsnittet ger en översikt över hur leverantörer kan aktivera OpenSharing och initiera delning från en Unity Catalog-aktiverad Azure Databricks arbetsyta. OpenSharing med öppen källkod finns i projektet open-source.

Delning mellan Databricks från Unity Catalog-metaarkiv i samma användarkonto är alltid aktiverad. Om du är en provider som vill aktivera OpenSharing för att dela data med Databricks-arbetsytor i andra konton eller icke-Databricks-klienter utför en Azure Databricks kontoadministratör eller metaarkivadministratör följande installationssteg (på hög nivå):

  1. Aktivera OpenSharing för Unity Catalog-metaarkivet som hanterar de data som du vill dela.

    Note

    Du behöver inte aktivera OpenSharing i metaarkivet om du tänker använda OpenSharing för att endast dela data med användare i andra Unity Catalog-metaarkiv i ditt konto. Som standard är delning av metaarkiv-till-metaarkiv i ett enda Azure Databricks-konto aktiverat.

    Se Aktivera OpenSharing i ett metaarkiv.

  2. Skapa en resurs som innehåller datatillgångar som registrerats i Unity Catalog-metaarkivet.

    Om du delar med en icke-Databricks-mottagare (kallas databricks-till-öppen-delning) kan du inkludera tabeller i Delta-format. Om du planerar att använda Databricks-till-Databricks-delning kan du också lägga till vyer, Unity Catalog-volymer, Unity Catalog-modeller och notebook-filer till en delning.

    Se Skapa resurser för OpenSharing.

  3. Skapa en mottagare.

    Se Skapa datamottagare för OpenSharing (Databricks-till-Databricks-delning).

    Om mottagaren inte är en Databricks-användare eller inte har åtkomst till en Databricks-arbetsyta som är aktiverad för Unity Catalog måste du använda Databricks-to-Open-delning. Du kan antingen generera ägartokenbaserade autentiseringsuppgifter för mottagaren eller använda OIDC-federation.

    Om mottagaren har åtkomst till en Databricks-arbetsyta som är aktiverad för Unity Catalog kan du använda Databricks-till-Databricks-delning och inga tokenbaserade autentiseringsuppgifter krävs. Du begär en delningsidentifierare från mottagaren och använder den för att upprätta den säkra anslutningen.

    Tip

    Använd dig själv som testmottagare för att prova konfigurationsprocessen.

  4. Ge mottagaren åtkomst till en eller flera resurser.

    Se Hantera åtkomst till OpenSharing-dataresurser (för leverantörer).

    Note

    Det här steget kan också utföras av en icke-administratörsanvändare med behörigheterna USE SHARE, USE RECIPIENT och SET SHARE PERMISSION . Se referens för Unity Catalog-behörigheter.

  5. Skicka den information som mottagaren behöver för att ansluta till resursen (endast Databricks-to-Open-delning).

    För databricks-till-öppen-delning med ägartoken använder du en säker kanal för att skicka mottagaren en aktiveringslänk som gör att de kan ladda ned sina tokenbaserade autentiseringsuppgifter. Se Skicka mottagaren deras anslutningsinformation.

    För databricks-till-öppen-delning med OIDC-tokenfederation skickar du den genererade portalens URL. Se Aktivera OIDC-federation (Open ID Connect) för OpenSharing-mottagare.

    För Databricks-till-Databricks-delning blir data som ingår i resursen tillgängliga på mottagarens Databricks-arbetsyta så snart du ger dem åtkomst till resursen.

Mottagaren kan nu komma åt delade data.

Hur kommer mottagarna åt delade data?

Mottagare får åtkomst till delade datatillgångar i läsbart format. Delade notebook-filer är skrivskyddade, men de kan klonas och sedan ändras och köras på mottagararbetsytan precis som andra notebook-filer.

Säker åtkomst beror på delningsmodellen:

När dataleverantören uppdaterar datatabeller eller volymer i sitt eget Databricks-konto visas uppdateringarna nästan i realtid i mottagarens system. Information om hur du får åtkomst till data som har delats med dig med OpenSharing finns i Åtkomst till data som delas med dig med Hjälp av OpenSharing (för mottagare).

Hur håller du reda på vem som delar och har åtkomst till delade data?

Dataleverantörer på Unity Catalog-aktiverade Azure Databricks-arbetsytor kan använda Azure Databricks-granskningsloggning och systemtabeller för att övervaka skapande och ändring av resurser och mottagare och kan övervaka mottagaraktivitet på resurser. Se Granska och övervaka datadelning.

Datamottagare som använder delade data på en Databricks-arbetsyta kan använda Databricks-granskningsloggning och systemtabeller för att förstå vem som har åtkomst till vilka data. Se Granska och övervaka datadelning.

Delning av volymer

Du kan dela volymer med databricks-till-databricks-delningsflödet. Se Lägga till volymer i en resurs (för leverantörer) och Läsa data som delas med Databricks-till-Databricks OpenSharing (för mottagare) (för mottagare).

Att dela modeller

Du kan dela modeller med Databricks-till-Databricks-delningsflödet. Se Lägga till modeller till en resurs (för leverantörer) och Läsa data som delas med Databricks-till-Databricks OpenSharing (för mottagare) (för mottagare).

Dela anteckningsböcker

Du kan använda OpenSharing för att dela notebook-filer med databricks-till-Databricks-delningsflödet. Se Lägg till anteckningsfiler i en delning (för leverantörer) och Läs delade anteckningsfiler (för mottagare).

Begränsa åtkomsten på rad- och kolumnnivå vid delning av vyer

Du kan dela dynamiska vyer som begränsar åtkomsten till vissa tabelldata baserat på mottagaregenskaper. Se Lägga till dynamiska vyer i en resurs för att filtrera rader och kolumner.

OpenSharing och strömning

OpenSharing stöder Apache Spark Structured Streaming. En provider kan dela en tabell med historik eller en strömmande tabell så att en mottagare kan använda den som en strukturerad strömningskälla och bearbeta delade data stegvis med låg svarstid. Mottagare kan också köra frågor om Delta Lake-tidsresor på tabeller som delas med historik.

Information om hur du delar tabeller med historik finns i Lägga till tabeller i en resurs. Information om hur du använder delade tabeller som strömmande källor finns i Fråga en tabell med Apache Spark Structured Streaming (för mottagare av Databricks-till-Databricks-delning) eller Få åtkomst till en delad tabell med Spark Structured Streaming (för mottagare av Databricks-till-Öppna-delningsdata).

Information om hur du delar strömmande tabeller finns i Lägga till strömmande tabeller till en resurs.

Se även Begrepp för strukturerad direktuppspelning.

Delta Lake-funktionsstödmatris

OpenSharing har stöd för de flesta Delta Lake-funktioner när du delar en tabell. Den här stödmatrisen listar:

  • Deltafunktioner som kräver specifika versioner av Databricks Runtime, OpenSharing Spark-anslutningsappen med öppen källkod eller OpenSharing Python-anslutningsappen med öppen källkod.
  • Funktioner som delvis stöds.
Feature Leverantör Databricks-användare Mottagare med öppen källkod
Vektorer för borttagning
  • Delning av tabeller med den här funktionen finns i offentlig förhandsversion.
  • Tabeller måste delas inklusive historik.
  • Databricks Runtime 14.1+ för batchfrågor
  • Databricks Runtime 14.2+ för CDF- och strömningsfrågor
  • OpenSharing Spark Connector 3.1+
  • OpenSharing Python connector 1.1.0+
  • Power BI v2.132.908.0+
Kolumnindelning
  • Delning av tabeller med den här funktionen finns i offentlig förhandsversion.
  • Tabeller måste delas inklusive historik.
  • Databricks Runtime 14.1+ för batchfrågor
  • Databricks Runtime 14.2+ för CDF- och strömningsfrågor
  • OpenSharing Spark Connector 3.1+
  • Stöds med begränsningar i OpenSharing Python connector
  • Power BI v2.132.908.0+
Enhetligt format
  • Delning av tabeller med den här funktionen finns i offentlig förhandsversion.
  • Tabeller måste delas inklusive historik.
  • Databricks Runtime 14.1+ för batchfrågor
  • Databricks Runtime 14.2+ för CDF- och strömningsfrågor
  • OpenSharing Spark Connector 3.1+
  • OpenSharing Python connector 1.1.0+
  • Power BI v2.132.908.0+
V2-kontrollpunkt Stöds med begränsningar Stöds med begränsningar Stöds med begränsningar
TimestampNTZ Supported Databricks Runtime 14.1+ OpenSharing Spark Connector 3.3+
Klustring av vätska Stöds med begränsningar Stöds med begränsningar Stöds med begränsningar

Vanliga frågor och svar om OpenSharing

Följande är vanliga frågor och svar om OpenSharing.

Behöver jag Unity Catalog för att använda OpenSharing?

Nej, du behöver inte Unity Catalog för att dela (som leverantör) eller använda delade data (som mottagare). Unity Catalog ger dock fördelar som stöd för icke-tabellära data och AI-tillgångsdelning, färdigförpackad styrning, enkelhet och förbättrad frågeprestanda.

Leverantörer kan dela data på två sätt:

  • Placera tillgångarna som ska delas under Hantering av Unity Catalog och dela dem med hjälp av den inbyggda Azure Databricks OpenSharing-servern.

    Du behöver inte migrera alla tillgångar till Unity Catalog. Du behöver bara en Azure Databricks-arbetsyta som är aktiverad för Unity Catalog för att hantera tillgångar som du vill dela. I vissa konton aktiveras nya arbetsytor automatiskt för Unity Catalog. Se Kom igång med Unity Catalog.

  • Implementera Databricks-to-Open-delningsservern för att dela data, utan att nödvändigtvis använda ditt Azure Databricks-konto.

Mottagare kan använda data på två sätt:

  • Utan en Databricks-arbetsyta. Använd open-source OpenSharing-anslutningsappar som är tillgängliga för många dataplattformar, inklusive Power BI, Pandas och open-source Apache Spark. Se Läsa data som delas med OpenSharing Databricks-to-Open-delning med ägartoken och Projektet OpenSharing open-source.

  • I en arbetsyta på Databricks. Mottagararbetsytor behöver inte aktiveras för Unity Catalog, men det finns fördelar med styrning, enkelhet och prestanda om de är det.

    Mottagarorganisationer som vill ha dessa fördelar behöver inte migrera alla tillgångar till Unity Catalog. Du behöver bara en Azure Databricks-arbetsyta som är aktiverad för Unity Catalog för att hantera tillgångar som delas med dig. I vissa konton aktiveras nya arbetsytor automatiskt för Unity Catalog. Se Kom igång med Unity Catalog.

Se Läsa data som delas med OpenSharing Databricks-to-Open-delning med ägartoken och Läsa data som delas med Databricks-till-Databricks OpenSharing (för mottagare).

Behöver jag vara Databricks-kund för att kunna använda OpenSharing?

Nej, OpenSharing är ett öppet protokoll. Du kan dela icke-Databricks-data med mottagare på valfri dataplattform. Leverantörer kan konfigurera en öppen OpenSharing-server att dela från valfri databehandlingsplattform. Mottagare kan använda delade data med hjälp av open-source OpenSharing-anslutningsappar för många dataprodukter, inklusive Power BI, Pandas och open-source Spark.

Men att använda OpenSharing på Azure Databricks, särskilt delning från en Unity Catalog-aktiverad arbetsyta, har många fördelar.

Mer information finns i den första frågan i dessa vanliga frågor och svar.

Hur ådrar jag mig och kontrollerar OpenSharing-kostnader?

Kostnaden för OpenSharing uppstår vid delning och åtkomst till vyer, materialiserade vyer och strömmande tabeller. Det här är de potentiella kostnadskällorna för delning:

  • Beräkningskostnad som debiteras av Azure Databricks.
  • Lagrings- och nätverksöverföringskostnad (utgående) som debiteras av lagringsleverantören eller av Azure Databricks om providern använder SecureConnect.
  • Kostnader för utländsk beräkningskälla när du delar externa scheman och tabeller.

Metoden som beräkning utförs med och vem som betalar för den beror på flera faktorer:

  • Typ av mottagande datorkapacitet
  • Om delning sker inom samma Azure Databricks-konto eller mellan konton

I följande tabell beskrivs faktureringsmetoden för delning och åtkomst till vyer med hjälp av OpenSharing:

Mottagarberäkning Kontoförhållande Vem betalar SKU som används för fakturering Åtkomstmetod
Databricks Serverless Any Recipient* Mottagarens serverlösa Mottagaren får direkt åtkomst till underliggande data
Databricks Klassisk Samma konto Recipient* Mottagarens klassiker Mottagaren får direkt åtkomst till underliggande data
Databricks Klassisk Annat konto Recipient Leverantörens interaktiva serverfria Leverantören utför filtrering
Anslutningsappar för databricks-till-öppen-delning Any Leverantör Leverantörens interaktiva serverfria Leverantören utför filtrering

* När du använder OpenSharing med en mottagare som använder serverlös beräkning i ett annat konto, eller med en mottagare i samma konto, finns det ingen inkrementell avgift. Det innebär att det inte finns någon extra kostnad för materialisering av datatillgången.

När du delar utländska tabeller (Beta) utförs materialisering alltid och lagras på leverantörens sida. För utländska Iceberg-tabeller utförs materialisering på leverantörens sida när man delar med en öppen mottagare som inte använder en Iceberg-klient. Leverantörer kan se en extra avgift som tillskrivs standardlagring som används för datamaterialisering. Det finns inga beräkningskostnader för utländska tabeller under Beta.

Faktureringsattribution kan också frågas med hjälp av tabellreferensen för fakturerbara användningssystem och systemtabellreferensen openSharing materialiseringshistorik. Om mottagaren betalar för attribution kan endast mottagaren se den associerade posten i systemtabellen. Exempelfrågor finns i Exempelfrågor.

Medför OpenSharing utgående kostnader?

OpenSharing inom en region medför ingen utgående kostnad. Till skillnad från andra datadelningsplattformar kräver OpenSharing inte datareplikering. Den här modellen har många fördelar, men det innebär att molnleverantören kan ta ut avgifter för utgående data när du delar data mellan moln eller regioner. Azure Databricks stöder delning från Cloudflare R2, som inte medför några utgående avgifter, och tillhandahåller andra verktyg och rekommendationer för att övervaka och undvika utgående avgifter. Se Övervaka och hantera OpenSharing-utgående kostnader (för leverantörer).

Men om providern använder SecureConnect debiteras dataöverföringen av Azure Databricks i stället för molnleverantören.

Har mottagarna direkt åtkomst till underliggande data i delade vyer, materialiserade vyer och strömmande tabeller?

För delade vyer, materialiserade vyer och strömmande tabeller har datamottagaren direkt åtkomst om något av följande är sant:

  • Mottagaren använder serverlös beräkning eller icke-dedikerad klassisk beräkning på samma Azure Databricks-konto.
  • Mottagaren använder serverlös beräkning på ett annat Azure Databricks-konto.

Annars materialiseras och filtreras data på providersidan.

Datamaterialiseringen lagras under den delade datatillgångens överordnade lagringsplats.

Vid delning av materialiserade tillgångar bearbetar beräkningen begäran genom att använda nödvändiga filter och skapa tillfällig materialisering som cachelagras i leverantörens lagring. Dessa filtrerade data levereras till mottagare med hjälp av försignerade kortlivade URL:er, vilket säkerställer säker åtkomst samtidigt som åtkomstkontroll mellan leverantörer och mottagare upprätthålls.

Kan leverantörer återkalla mottagaråtkomst?

Ja, mottagaråtkomst kan återkallas på begäran och på angivna detaljnivåer. Du kan neka mottagaren åtkomst till specifika delningar och specifika IP-adresser, filtrera tabelldata för en mottagare, återkalla mottagartoken och ta bort mottagare helt. Se Återkalla mottagaråtkomst till en resurs och Skapa datamottagare för OpenSharing (Databricks-till-Databricks-delning).

Är det inte osäkert att använda försignerade URL:er?

OpenSharing använder försignerade URL:er för att ge tillfällig åtkomst till en fil i objektlagring. De ges endast till mottagare som redan har åtkomst till delade data. De är säkra eftersom de är kortvariga och inte utökar åtkomstnivån utöver vad mottagarna redan har beviljats.

Är de token som används i delningsprotokollet OpenSharing Databricks-to-Open säkra?

Eftersom OpenSharing möjliggör plattformsoberoende delning , till skillnad från andra tillgängliga datadelningsplattformar, kräver delningsprotokollet en öppen token. Leverantörer kan garantera tokensäkerhet genom att konfigurera tokens livslängd, ange nätverkskontroller och återkalla åtkomst på begäran. Dessutom expanderar token inte åtkomstnivån utöver vad mottagarna redan har beviljats. Se Säkerhetsöverväganden för token.

Om du föredrar att inte använda tokens för att hantera åtkomst till mottagaraktier bör du använda Databricks-till-Databricks-delning eller kontakta Databricks-kontoteamet för alternativ.

Vad är skillnaden mellan Lakeflow Connect och OpenSharing?

Med OpenSharing kan du dela livedata på ett säkert sätt mellan plattformar, moln och regioner. Databricks rekommenderar inmatning med hjälp av hanterade anslutningsappar eftersom de är anpassade för att hantera stora datavolymer, frågor med låg latens och API-gränser från tredje part. Men du kanske vill köra frågor mot dina data utan att flytta dem.

När du har ett val mellan hanterade anslutningsappar och OpenSharing väljer du OpenSharing för följande scenarier:

  • Begränsa dataduplicering.
  • Fråga efter den färskaste möjliga datan.

Begränsningar

Stöd för tabellformat och funktioner

Formatkrav:

  • Tabelldata måste vara i Delta eller Managed Iceberg-tabellformat. Du kan enkelt konvertera Parquet-tabeller till Delta – och tillbaka igen. Se även CONVERT TO DELTA.
  • OpenSharing kan bara läsa UniForm-tabeller som Delta-tabeller.

Tabeller som inte stöds:

Databricks-till-Databricks-delning

Följande tillgångar kan bara delas med databricks-till-Databricks-delningsflödet:

Views

Strömmande

  • OpenSharing stöder inte ändring responseFormat när en strömningskälla körs eller under omstarter av strömning.

Metadata för mottagare

  • Tabellerna i information_schema från en delad katalog återspeglar metadata som lagras i Unity Catalog. Dessa metadata uppdateras endast från providern när du frågar den delade tabellen direkt eller kör ett kommando som DESCRIBE eller REFRESH FOREIGN. Tills dess kan information_schema verka inaktuellt jämfört med leverantörens data.

Resurs- och tekniska begränsningar

  • Det finns gränser för hur många filer i metadata som tillåts för en delad tabell. Mer information finns i Fel om överskridna resursgränser.
  • Scheman med namnet information_schema kan inte importeras till ett Unity Catalog-metaarkiv eftersom det schemanamnet är reserverat i Unity Catalog.

Se även Delta Lake-funktionsstödmatris.

Kaskadborttagning åsidosätter delningsskydd

Om du tar bort ett överordnat objekt, till exempel en katalog eller ett schema, utlöses en kaskadborttagning av dess underordnade objekt, även om dessa underordnade objekt ingår i aktiva resurser. När en kaskadborttagning tar bort en tillgång kan du inte lägga till en tillgång med samma namn i resursen igen.

Undvik det här problemet genom att ta bort tillgångar från alla resurser innan du tar bort deras överordnade objekt.

Resurskvoter

Azure Databricks framtvingar resurskvoter för alla OpenSharing-skyddsbara objekt. Dessa kvoter visas i Resursgränser. Om du förväntar dig att överskrida dessa resursgränser kontaktar du ditt Azure Databricks-kontoteam.

Du kan övervaka din kvotanvändning med hjälp av API:erna för Enhetskatalogens resurskvoter. Se Övervaka din användning av Unity Catalog-resurskvoter.

Ytterligare resurser