Wat is het OpenSharing Databricks-to-Open-sharing-protocol?

Deze pagina geeft een overzicht van hoe providers het OpenSharing Databricks-to-Open-sharing-protocol kunnen gebruiken om gegevens te delen vanuit uw Unity Catalog-Azure Databricks werkruimte met elke gebruiker op elk computerplatform, waar dan ook. Als u een gegevensontvanger bent (een gebruiker of groep gebruikers met wie gegevens worden gedeeld), raadpleeg dan Toegang krijgen tot gegevens die via OpenSharing met u worden gedeeld (voor ontvangers).

Wie moet het OpenSharing Databricks-to-Open-sharing-protocol gebruiken?

Er zijn drie manieren om gegevens te delen met behulp van OpenSharing:

  1. Met het Databricks-to-Open-protocol voor delen, dat in dit artikel wordt besproken, kunt u gegevens delen die u beheert in een Databricks-werkruimte met Unity Catalog en gebruikers op elk computerplatform.

    Deze benadering maakt gebruik van de OpenSharing-server die is ingebouwd in Azure Databricks en is handig wanneer u gegevens beheert met behulp van Unity Catalog en deze wilt delen met gebruikers die geen Databricks gebruiken of geen toegang hebben tot een Databricks-werkruimte met Unity Catalog. De integratie met Unity Catalog aan de providerzijde vereenvoudigt het instellen en beheren van providers.

  2. Met een door de klant beheerde implementatie van de open-source OpenSharing-server kunt u vanaf elk platform naar elk platform delen, ongeacht of het om Databricks gaat of niet.

    Zie het open source project.

  3. Met het Databricks-to-Databricks-protocol voor delen kunt u gegevens delen vanuit uw Unity Catalog-werkruimte met gebruikers die ook toegang hebben tot een Databricks-werkruimte met Unity Catalog.

    Zie Wat is het OpenSharing Databricks-to-Databricks-protocol?

Zie Wat is OpenSharing?voor een inleiding tot OpenSharing en meer informatie over deze drie benaderingen.

OpenSharing Databricks-to-Open-werkstroom voor delen

Deze sectie biedt een algemeen overzicht van de Databricks-to-Open-werkstroom voor delen, met koppelingen naar gedetailleerde documentatie voor elke stap.

In het OpenSharing Databricks-naar-Open Sharing-deelmodel:

  1. De gegevensprovider maakt een ontvanger, een benoemd object dat een gebruiker of groep gebruikers vertegenwoordigt waarmee de gegevensprovider gegevens wil delen.

    Wanneer de gegevensprovider de ontvanger maakt, stelt de provider verificatie in met behulp van een bearer-token met lange levensduur of OIDC-federatie (Open ID Connect). Als de provider een Bearer-token gebruikt, genereert Azure Databricks een referentiebestand en een activeringskoppeling die de gegevensprovider naar de ontvanger kan verzenden om toegang te krijgen tot het referentiebestand. In de OIDC-federatiestroom beheert de idP van de ontvanger verificatie op basis van een beleid dat door de provider is gemaakt.

    Zie Een ontvangerobject maken voor niet-Databricks-gebruikers met bearertokens (Databricks-to-Open sharing) of Open ID Connect (OIDC)-federatie inschakelen voor Open Sharing-ontvangers voor meer informatie.

  2. De gegevensprovider maakt een share, een benoemd object dat een verzameling tabellen bevat die zijn geregistreerd in een Unity Catalog-metastore in het account van de provider.

    Zie Shares maken voor OpenSharing voor meer informatie.

  3. De gegevensprovider verleent de ontvanger toegang tot de share.

    Zie Toegang tot OpenSharing-datashares beheren (voor aanbieders) voor meer informatie.

  4. In de bearer-tokenstroom verzendt de gegevensprovider de activeringskoppeling naar de ontvanger via een beveiligd kanaal, samen met instructies voor het gebruik van de activeringskoppeling om het referentiebestand te downloaden dat de ontvanger gebruikt om een beveiligde verbinding met de gegevensprovider tot stand te brengen om de gedeelde gegevens te ontvangen.

    Zie De activeringslink ophalenvoor details.

    In de OIDC-federatiestroom verifiëren ontvangers zich via hun IdP. Zie Open ID Connect -federatie (OIDC) inschakelen voor OpenSharing-ontvangers.

  5. In de bearer-tokenstroom volgt de gegevensontvanger de activeringskoppeling om het referentiebestand te downloaden en gebruikt het referentiebestand vervolgens om toegang te krijgen tot de gedeelde gegevens.

    Gedeelde gegevens zijn alleen voor lezen beschikbaar. Gebruikers hebben toegang tot gegevens via hun platform of hulpprogramma's van keuze. Zie Gegevens lezen die worden gedeeld met behulp van OpenSharing Databricks-to-Open Sharing met bearertokens voor meer informatie.

    In de OIDC-federatiestroom verifiëren ontvangers zich via hun IdP. Zie Open ID Connect -federatie (OIDC) inschakelen voor OpenSharing-ontvangers.

provider-specifieke configuraties

Veel providers hebben hun eigen OpenSharing-netwerken voor delen. Zie bijvoorbeeld voor specifieke instructies voor delen:

Cloudtokens en toegang op basis van mappen

Wanneer u in aanmerking komende Delta-tabellen deelt met databricks-to-Open, retourneert Azure Databricks de cloudopslaglocatie van de tabel naast tijdelijke cloudreferenties (cloudtokens) die ontvangers kunnen gebruiken om gegevens rechtstreeks vanuit de cloudopslag te lezen. Dit wordt de toegangsmodus op basis van mappen genoemd en maakt deel uit van het Databricks-to-Open-sharing-protocol. Deze functie is standaard ingeschakeld voor nieuw gedeelde assets die voldoen aan de geschiktheidsvereisten. Als een gedeelde tabel niet aan alle vereisten voldoet, maken geadresseerden zoals gewoonlijk gebruik van een vooraf ondertekende URL-toegang.

Zie voor geschiktheidsvereisten en overwegingen voor gegevensprivacy de geschiktheid van cloudtoken.

Providerconfiguratie en beveiligingsoverwegingen voor Databricks-naar-Open-deling

Goed tokenbeheer is essentieel voor het veilig delen van gegevens wanneer u het Databricks-to-Open-model voor delen gebruikt:

  • Gegevensproviders op Azure Databricks die Databricks-naar-Open-sharing willen gebruiken als ze shares verstrekken, moeten de standaardgeldigheidsduur van het ontvangertoken configureren wanneer ze OpenSharing inschakelen voor hun Unity Catalog-metastore. Databricks raadt u aan tokens zo te configureren dat ze verlopen. Zie OpenSharing inschakelen in een metastore.
  • Als u de standaardtokenlevensduur wilt wijzigen, raadpleegt u De levensduur van het ontvangerstoken wijzigen.
  • Moedig ontvangers aan om hun gedownloade referentiebestand veilig te beheren.
  • Zie Ontvangerstokens beheren voor meer informatie over tokenbeheer en Databricks-to-Open-beveiliging voor delen.
  • Het delen van Databricks-to-Open wordt ondersteund tussen alle typen cloudomgevingen.

Gegevensproviders kunnen extra beveiliging bieden door IP-toegangslijsten toe te wijzen om de toegang van geadresseerden tot specifieke netwerklocaties te beperken. Zie Toegang voor Open Sharing-ontvangers beperken met IP-toegangslijsten (Databricks-naar-Open Sharing).