Introdução ao Catálogo Unity

O Unity Catalog é a camada unificada de governação para dados e IA no Azure Databricks. Proporciona controlo centralizado de acesso, linhagem, auditoria e descoberta de dados em todos os seus espaços de trabalho. Veja O que é o Unity Catalog?.

O Unity Catalog está automaticamente ativado para todos os espaços de trabalho do Azure Databricks criados após 9 de novembro de 2023. Se o seu espaço de trabalho já tiver o Unity Catalog ativado, siga o tutorial de configuração. Se o seu espaço de trabalho é anterior ao Unity Catalog ou não estava ativado na criação, siga o guia de atualização.

Guide Description
Guia de configuração do Unity Catalog Para espaços de trabalho com o Unity Catalog já ativado. Configure funções administrativas, utilizadores, computação, permissões e catálogos.
Atualizar para o Unity Catalog Para espaços de trabalho existentes que ainda não estão no Unity Catalog. Ativa o Unity Catalog e migra os teus dados.

Estende a tua configuração do Unity Catalog

Depois de configurado o seu espaço de trabalho, pode aplicar capacidades de governação mais avançadas aos seus fluxos de trabalho de dados e IA.

Controle de acesso baseado em atributos

O controlo de acesso baseado em atributos (ABAC) permite-lhe definir políticas de acesso dinâmicas e detalhadas com base nos atributos dos dados e no utilizador que os acede. Em vez de gerir permissões tabela a tabela, escreve políticas que aplicam automaticamente filtragem ao nível da linha e mascaramento ao nível das colunas. Por exemplo, pode esconder colunas sensíveis de utilizadores fora de uma região específica ou mascarar PII para funções não privilegiadas.

Mascaramento de colunas ABAC em ação

Classificação dos dados

A classificação de dados utiliza um agente de IA para escanear automaticamente o seu catálogo e etiquetar dados sensíveis, como PII, informações financeiras e credenciais. Após a classificação, as etiquetas podem integrar-se diretamente com as políticas ABAC, permitindo-lhe aplicar controlos de governação com base no que os dados realmente contêm, em vez de gerir o acesso objeto a objeto.

Resultados da classificação de dados

Monitorização da qualidade dos dados

A monitorização da qualidade dos dados proporciona deteção de anomalias em todas as tabelas num esquema e perfis de dados ao nível da tabela. A deteção de anomalias monitoriza automaticamente a atualidade e a integridade com base em padrões históricos dos dados, assinalando problemas sem necessidade de configuração manual. O perfil de dados capta distribuições estatísticas ao longo do tempo, permitindo-lhe acompanhar a integridade dos dados e definir alertas para alterações inesperadas.

Painel de monitorização da qualidade dos dados

Linhagem de dados

A linhagem de dados captura automaticamente a forma como os dados fluem entre tabelas, notebooks, tarefas e pipelines — até ao nível da coluna. Podes rastrear a origem de qualquer coluna, ver que ativos a jusante dependem dela e compreender o impacto total de uma alteração de esquema antes de a fazer.

Linhagem de dados ao nível da coluna

Governação da IA com o Unity AI Gateway

O Unity AI Gateway estende a governação do Unity Catalog à IA. Fornece governação empresarial para endpoints LLM, agentes e servidores MCP, permitindo-lhe implementar controlo de acesso, registo de auditoria e observabilidade em todas as interações de IA numa interface unificada.

Para uma visão geral completa das capacidades do Unity Catalog, consulte O que é o Unity Catalog?. Para melhores práticas de governação, consulte as melhores práticas do Unity Catalog.