Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Esta página explica como aceder a dados que foram partilhados consigo através do OpenSharing. O OpenSharing suporta dois modelos: partilha Databricks-para-Databricks, para utilizadores de espaços de trabalho Azure Databricks com Unity Catalog, e partilha Databricks-para-Open, para qualquer destinatário que utilize qualquer ferramenta.
OpenSharing e destinatários de dados
O OpenSharing é um padrão aberto para partilha segura de dados. Um utilizador Databricks, referido como fornecedor de dados neste contexto, pode usar o OpenSharing no Azure Databricks para partilhar dados com uma pessoa ou grupo fora da sua organização, chamado destinatário de dados.
Partilha de Databricks para Databricks e de Databricks para partilha aberta
A forma como você acessa os dados depende se você mesmo é um usuário do Databricks e se seu provedor de dados configurou ou não os dados que estão sendo compartilhados com você para compartilhamento de Databricks para Databricks ou compartilhamento aberto.
No modelo Databricks-to-Databricks, você deve ser um usuário em um espaço de trabalho Databricks habilitado para o Unity Catalog. Um membro da sua equipe fornece ao provedor de dados um identificador exclusivo para o metastore do Unity Catalog, e o provedor de dados usa isso para criar uma conexão de compartilhamento segura. Os dados compartilhados ficam disponíveis para acesso em seu espaço de trabalho. Se necessário, um membro da sua equipe configura o controle de acesso granular nesses dados.
No modelo de partilha Databricks-to-Open, pode usar qualquer ferramenta que desejar (incluindo Databricks) para aceder aos dados partilhados. O fornecedor de dados envia-lhe um URL de ativação ou uma ligação de portal através de um canal seguro. Segue-o para transferir um ficheiro de credenciais ou um URL que lhe permite aceder aos dados que foram partilhados consigo.
Os dados compartilhados não são fornecidos diretamente pelo Databricks, mas por provedores de dados em execução no Azure Databricks.
Note
A Databricks pode coletar informações sobre o uso e o acesso dos destinatários dos dados aos dados compartilhados (incluindo a identificação de qualquer indivíduo ou empresa que acesse os dados usando o arquivo de credenciais em conexão com essas informações) e pode compartilhá-las com o provedor de dados aplicável.
Tenha acesso aos dados partilhados consigo
A forma como acede aos dados depende se o seu fornecedor de dados partilhou os dados consigo usando o protocolo de partilha Databricks-to-Open ou o protocolo de partilha Databricks-to-Databricks. Veja partilha Databricks-para-Databricks e partilha Databricks-para-Open.
Obtenha acesso no modelo Databricks-to-Databricks
No modelo Databricks-to-Databricks:
O provedor de dados envia instruções para localizar um identificador exclusivo para o metastore do Unity Catalog associado ao seu espaço de trabalho Databricks e você o envia para eles.
O identificador de compartilhamento é uma cadeia de caracteres que consiste na nuvem, região e UUID (o identificador exclusivo do metastore), no formato
<cloud>:<region>:<uuid>. Por exemplo,aws:eu-west-1:b0c978c8-3e68-4cdf-94af-d05c120ed1ef.Para obter o identificador de compartilhamento usando o Gerenciador de Catálogos:
No seu espaço de trabalho do Azure Databricks, clique no
Catálogo.
No topo do painel de Catálogo , clique no
ícone de engrenagem e selecione OpenSharing.
Alternativamente, no canto superior direito, clique em Partilhar > OpenSharing.
No separador Partilhado comigo, selecione o nome da sua organização de partilha Databricks no canto superior direito e selecione Copiar identificador de partilha.
Para obter o identificador de compartilhamento usando um bloco de anotações ou uma consulta SQL do Databricks, use a função
CURRENT_METASTORESQL padrão. Se utilizar um computador portátil, este deverá operar no padrão ou no modo de acesso dedicado no espaço de trabalho que usará para aceder aos dados partilhados.SELECT CURRENT_METASTORE();O provedor de dados cria:
- Um destinatário na conta Databricks para representar si e os utilizadores na sua organização que acederão aos dados.
- Um compartilhamento, que é uma representação das tabelas, volumes e exibições a serem compartilhados com você.
Você acessa os dados compartilhados com você. Você ou alguém da sua equipe pode, se necessário, configurar o acesso a dados granulares nesses dados para seus usuários. Veja Ler dados partilhados usando Databricks-para-Databricks OpenSharing (para destinatários).
Obtenha acesso no modelo de partilha Databricks-to-Open
No modelo de partilha Databricks-para-Open:
O provedor de dados cria:
- Um destinatário na conta Databricks para representar si e os utilizadores na sua organização que acederão aos dados.
- Um compartilhamento, que é uma representação das tabelas e partições a serem compartilhadas com você.
O fornecedor de dados envia-lhe um URL de ativação (através de um canal seguro) ou um URL do portal. Siga o link para descarregar um ficheiro de credenciais ou um URL que lhe permite aceder aos dados partilhados consigo.
Ambos os tokens de portador e credenciais de cliente OAuth são suportados.
Importante
Não compartilhe o link de ativação com ninguém. Você pode baixar um arquivo de credenciais apenas uma vez. Se você visitar o link de ativação novamente depois que o arquivo de credenciais já tiver sido baixado, o botão Baixar arquivo de credenciais será desativado.
Se você perder o link de ativação antes de usá-lo, entre em contato com o provedor de dados.
Armazene o arquivo de credenciais em um local seguro.
Não compartilhe o arquivo de credenciais com ninguém fora do grupo de usuários que deve ter acesso aos dados compartilhados. Se você precisar compartilhá-lo com alguém em sua organização, o Databricks recomenda o uso de um gerenciador de senhas.
Ler os dados partilhados
A forma como lê os dados que foram partilhados de forma segura consigo através do OpenSharing depende se recebeu um ficheiro de credencial (o modelo de partilha Databricks-to-Open) ou se está a usar um espaço de trabalho Databricks e forneceu ao fornecedor de dados o seu identificador de partilha (o modelo Databricks-para-Databricks).
Note
Se receber um erro informando que um ativo de dados não existe ao tentar ler as suas partilhas, veja Erro de "ativo de dados não existe".
Leia dados partilhados usando um ficheiro de credencial (Databricks-to-Open sharing)
Se os dados tiverem sido partilhados consigo através do protocolo de partilha OpenSharing Databricks-to-Open com tokens de portador, utiliza o ficheiro de credenciais que descarregou para se autenticar na conta do fornecedor de dados e ler os dados partilhados. O acesso persiste enquanto o token subjacente for válido e o provedor continuar a compartilhar os dados. Os provedores gerenciam a expiração e a rotação do token. Os tokens são válidos por um máximo de um ano após a criação. As atualizações dos dados estão disponíveis para você quase em tempo real. Você pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.
Para aprender a aceder e ler dados partilhados usando o ficheiro de credenciais no Azure Databricks, Apache Spark, pandas e Power BI, consulte Ler dados partilhados usando OpenSharing Databricks-to-Open com tokens portadores.
Leia dados partilhados usando uma federação OIDC (Databricks-para-Partilha Open)
Se os dados forem partilhados consigo usando o protocolo OpenSharing Databricks-to-Open com federação OIDC, utiliza o URL que lhe foi enviado para se autenticar na conta do fornecedor de dados e ler os dados partilhados. O acesso persiste enquanto o provedor continuar a compartilhar os dados. As atualizações dos dados estão disponíveis para você quase em tempo real. Você pode ler e fazer cópias dos dados compartilhados, mas não pode modificar os dados de origem.
Para aprender a aceder e ler dados partilhados usando o fluxo de federação de tokens OIDC no Tableau e Power BI, veja Leia dados partilhados usando a federação Open ID Connect (OIDC) num fluxo U2M. Para aprender a aceder e ler dados partilhados usando o fluxo de federação de tokens OIDC numa aplicação cliente Python, consulte Ler dados partilhados usando a federação Open ID Connect (OIDC) num fluxo M2M.
Ler dados compartilhados usando o compartilhamento de Databricks para Databricks
Se os dados tiverem sido compartilhados com você usando o modelo Databricks-to-Databricks, nenhum arquivo de credencial será necessário para acessar os dados compartilhados. O Databricks cuida da conexão segura e os dados compartilhados são automaticamente detetáveis em seu espaço de trabalho Databricks.
Para aprender a encontrar, ler e gerir esses dados partilhados no seu espaço de trabalho Databricks, consulte Ler dados partilhados usando Databricks-to-Databricks OpenSharing (para destinatários).
Auditar o uso de dados compartilhados
Se tiver acesso a um espaço de trabalho do Azure Databricks, pode usar os registos de auditoria do Azure Databricks para perceber quem na sua organização está a aceder a que dados através do OpenSharing. Consulte Auditar e monitorar o compartilhamento de dados.