Compartilhar via


Detecção de anomalias

Importante

Esse recurso está em Visualização Pública.

Esta página descreve o que é a detecção de anomalias, o que ela monitora e como usá-la.

Importante

A detecção de anomalias usa o armazenamento padrão para armazenar os resultados da verificação na tabela do system.data_quality_monitoring.table_results sistema. Você não é cobrado por esse armazenamento.

O que é detecção de anomalias?

A detecção de anomalias permite monitorar a qualidade dos dados em todas as tabelas em um esquema. Analisando padrões históricos, Azure Databricks avalia automaticamente a integridade e o frescor de cada tabela. Os resultados estão disponíveis no Gerenciador de Catálogos.

Requisitos

  • Workspace habilitado para Catálogo do Unity.
  • A computação sem servidor deve estar disponível em seu workspace (habilitada por padrão em workspaces com o Catálogo do Unity).
  • Para habilitar a detecção de anomalias em um esquema, você deve ter privilégios MANAGE SCHEMA ou MANAGE CATALOG no esquema de catálogo.
  • Para exibir o status do indicador de integridade das tabelas, você precisa de SELECT ou privilégios de navegação.

Como funciona a detecção de anomalias?

Azure Databricks cria um trabalho em segundo plano que monitora tabelas para atualização e integridade.

Freshness indica há quanto tempo uma tabela foi atualizada. O monitoramento da qualidade de dados analisa o histórico de confirmações em uma tabela e cria um modelo para cada tabela para prever a hora da próxima confirmação. Se um commit estiver atrasado de forma incomum, a tabela será marcada como obsoleta.

Completude refere-se ao número de linhas que devem ser gravadas na tabela nas últimas 24 horas. O monitoramento de qualidade de dados analisa a contagem de linhas históricas e, com base nesses dados, prevê um intervalo de número esperado de linhas. Se o número de linhas com commit nas últimas 24 horas for menor que o limite inferior previsto, a tabela é marcada como incompleta.

Azure Databricks usa o escaneamento inteligente para automatizar as frequências de escaneamento de tabelas. A verificação inteligente prioriza tabelas de alto impacto, conforme determinado pela popularidade e pelo uso em processos subsequentes, e reduz a frequência para tabelas de menor importância. Para excluir tabelas manualmente, use a API Criar um Monitor ou Atualizar um Monitor e especifique as tabelas excluídas no excluded_table_full_names parâmetro. Para obter mais informações, consulte a documentação do API.

A detecção de anomalias não modifica as tabelas monitoradas, nem adiciona sobrecarga a trabalhos que preenchem essas tabelas.

Observação

A atualização do evento, que se baseia em colunas de tempo de evento e latência de ingestão, estava disponível apenas para usuários da versão beta de monitoramento de qualidade de dados. Na versão atual, não há suporte para a atualidade do evento.

Porcentagem nula para integridade

Importante

Esse recurso está em Beta. Os administradores do workspace podem controlar o acesso a esse recurso na página Visualizações . Consulte Gerenciar versões de pré-visualização do Azure Databricks.

Porcentagem nula adiciona detalhes adicionais de qualidade à integridade. Percentual nulo é o percentual de linhas gravadas na tabela nas últimas 24 horas que devem ter valores nulos para uma determinada coluna. O monitoramento de qualidade de dados analisa a tendência histórica de cada coluna e, com base nesses dados, prevê um intervalo. Se a porcentagem nula de uma coluna nas últimas 24 horas for maior que o limite superior desse intervalo, uma tabela será marcada como incompleta.

Habilitar a detecção de anomalias em um esquema

Para habilitar a detecção de anomalias em um esquema, navegue até o esquema no Catálogo do Unity.

  1. Na página do esquema, clique na guia Detalhes .

    Guia Detalhes da página de esquema no Explorador de Catálogo.

  2. Clique em Habilitar. Na caixa de diálogo Monitoramento de Qualidade de Dados , verifique se a detecção de anomalias está ativada e clique em Salvar.

  3. Uma verificação é iniciada. O Databricks verifica automaticamente cada tabela na mesma frequência em que ela é atualizada, fornecendo insights atualizados sem a necessidade de configuração manual para cada tabela. Para esquemas habilitados antes de 24 de setembro de 2025, o Databricks executou o monitor em dados históricos ("backtesting") para a primeira verificação, para verificar a qualidade de suas tabelas como se o monitoramento de qualidade de dados tivesse sido habilitado em seu esquema há duas semanas.

  4. Depois que a verificação for concluída, você poderá exibir os resultados da detecção de anomalias para suas tabelas das seguintes maneiras:

Desabilitar a detecção de anomalias

Para desabilitar a detecção de anomalias:

  1. Clique no ícone de lápis.

    Ícone de lápis no campo Avançado da guia Detalhes.

  2. Na caixa de diálogo Monitoramento de Qualidade de Dados, clique no interruptor.

    Importante

    Quando você desabilitar a detecção de anomalias, o trabalho de detecção de anomalias e todas as tabelas e informações de detecção de anomalias são excluídos. Esta ação não pode ser desfeita.

    Alterne a opção na caixa de diálogo Monitoramento de Qualidade de Dados.

  3. Clique em Salvar.

Indicadores de saúde

Depois de habilitar a detecção de anomalias em um esquema, os indicadores de integridade aparecem nas páginas de visão geral do esquema e da tabela no Gerenciador de Catálogos. O indicador de integridade mostra um resumo da integridade da tabela para consumidores de dados e usuários empresariais sem exigir que eles naveguem até a interface do usuário do Monitoramento de Qualidade de Dados. Os usuários precisam da SELECT permissão ou da permissão BROWSE para visualizar o status do indicador de integridade.

Indicadores de saúde para tabelas em um esquema.

A tabela a seguir descreve cada status de indicador de integridade:

Situação Descrição
Saudável Todas as verificações de detecção de anomalias foram aprovadas durante a verificação mais recente.
Não saudável Uma ou mais verificações detectaram uma anomalia, como um problema de atualização ou de integridade.
Treinamento A detecção de anomalias está criando um modelo de linha de base com base em dados históricos. Tabelas monitoradas recentemente exibem esse status até que o modelo tenha dados suficientes para avaliar a qualidade.
Erro A detecção de anomalias encontrou um erro ao monitorar esta tabela.
Excluído A tabela é explicitamente excluída da detecção de anomalias.
não ativado A detecção de anomalias não está habilitada no esquema que contém essa tabela.

Observação

A verificação inteligente poderá atrasar a população de indicadores de integridade para algumas tabelas em até duas semanas se a tabela tiver sido ignorada durante a verificação inicial. O indicador de saúde é preenchido na próxima reverificação agendada.

Exibir os resultados do monitoramento de qualidade de dados na interface do usuário

Importante

Em 7 de outubro de 2025, o Databricks lançou uma nova versão da interface do usuário do Monitoramento de Qualidade de Dados. Esquemas habilitados para monitoramento de qualidade de dados em ou após essa data usam automaticamente essa nova interface do usuário. Esta seção descreve esta versão mais recente da interface do usuário.

Para obter informações sobre a interface do usuário herdada, consulte o painel de qualidade de dados (herdado).

O Databricks recomenda que você habilite a nova versão para todos os esquemas existentes.

Para habilitar a nova versão, clique na alternância monitoramento de qualidade de dados para desativar o recurso e clique novamente para ativá-lo novamente.

Depois de habilitar o monitoramento de qualidade de dados em um esquema, você pode abrir a página de resultados clicando em Exibir resultados. Você também pode acessar os resultados de todos os esquemas que têm o monitoramento habilitado no Gerenciador de Catálogos.

A interface do usuário de resultados contém listas suspensas de catálogo e esquema. Quando você seleciona um catálogo, a lista suspensa de esquema é preenchida com esquemas nesse catálogo que têm o monitoramento de qualidade de dados habilitado.

  • Se você tiver MANAGE ou SELECT privilégios no catálogo, poderá visualizar incidentes no nível do catálogo. Para exibir todos os incidentes em um catálogo, selecione Todos os Esquemas no menu de Esquema.

    Selecionar Todos os Esquemas no menu suspenso Esquema.

  • Para exibir incidentes para um esquema específico, você também deve ter GERENCIAR ou SELECT privilégios nesse esquema. Selecionar um esquema mostra incidentes apenas para esse esquema.

A página de resultados mostra uma seção de resumo na parte superior, que exibe a qualidade geral dos dados para o escopo selecionado, incluindo a porcentagem de tabelas íntegras e o percentual de esquemas/tabelas monitorados no momento. Abaixo desta seção está uma tabela listando incidentes em todas as tabelas monitoradas no escopo selecionado. Use os botões para exibir tabelas não saudáveis, saudáveis ou de erro.

UI de Incidentes mostrando resumo, incidentes importantes e todas as abas de incidentes.

A tabela a seguir descreve as colunas, que são ligeiramente diferentes dependendo se você selecionar Não Íntegro, Íntegro ou Erro.

Coluna Descrição
Situação Healthy, Unhealthy ou Training.
Detectado pela primeira vez Quando o primeiro incidente foi detectado. Aparece apenas na guia Impróprio.
Última verificação Quando a tabela foi escaneada pela última vez. Aparece apenas na guia Saudável.
Reason Se a tabela está comprometida devido à atualização ou à integridade. Aparece apenas na guia Impróprio.
Causa raiz Informações sobre tarefas upstream que contribuem para o problema (consulte Verificar os resultados logados de detecção de anomalias para obter detalhes). Aparece apenas na guia Impróprio.
Impacto Uma medida qualitativa de impacto downstream (Alta, Média ou Baixa), com base no número de tabelas downstream e consultas afetadas.
Frequência de escaneamento Com que frequência a tabela foi verificada na última semana.
Resultados Um link para a página de qualidade da tabela em que você pode exibir tendências históricas e visualizações explicando por que uma anomalia foi detectada.
Estado do erro Mensagem de erro. Aparece apenas na guia Erro .
Detalhes Detalhes sobre a mensagem de erro. Aparece apenas na guia Erro .

Exibir resultados no nível do metastore

Esta seção fornece um modelo que você pode importar para seu workspace. Esse modelo cria um painel que permite exibir todos os resultados de qualidade no metastore.

Para usar esse modelo, você deve ter acesso à system.data_quality_monitoring.table_results tabela. Por padrão, somente os administradores de conta têm acesso a essa tabela. Eles podem conceder acesso a outras pessoas conforme necessário.

Como usar o modelo

Siga estas etapas:

  1. Baixe o arquivo de modelo: metastore-quality-dashboard.lvdash.json.
  2. Na barra lateral do workspace, clique no Ícone de PainéisPainéis.
  3. No canto superior direito, selecione Importar painel do arquivo no menu suspenso Criar painel.
  4. Na caixa de diálogo, clique em Escolher arquivo, navegue até o arquivo de modelo e clique em Importar painel.

O arquivo é importado e o painel é exibido.

Exemplo do painel de qualidade de dados no nível do metastore.

Detalhes da qualidade da tabela

A Interface do Usuário Detalhes da Qualidade da Tabela permite que você se aprofunde nas tendências e entenda por que anomalias foram detectadas para tabelas específicas no seu esquema. Você pode acessar essa exibição de várias maneiras:

  • Na interface de resultados do usuário (nova experiência), clique no link de revisão na lista de incidentes.
  • No Painel de Monitoramento (painel herdado do Lakeview), clicando no nome da tabela na guia Visão Geral da Qualidade.
  • No UC Table viewer, ao visitar a Quality tab na página da tabela.

Todas as opções levam você à mesma visualização Detalhes de Qualidade da Tabela para a tabela selecionada.

Dada uma tabela, a interface do usuário mostra os resumos de cada verificação de qualidade realizada na tabela, com gráficos de valores previstos e observados em cada instante de avaliação. Os gráficos plotam os resultados da última semana de dados.

Interface de Detalhes da Qualidade da Tabela para detecção de anomalias.

Se a tabela falhar nas verificações de qualidade, a interface do usuário também exibirá quaisquer processos anteriores identificados como a causa raiz.

Tabela de causa raiz da interface de detalhes de qualidade da tabela.

Configurar alertas

Para configurar um alerta do Databricks SQL na tabela de resultados de saída, consulte Alertas para detecção de anomalias.

Limitações

  • A detecção de anomalias não dá suporte a exibições ou tabelas estrangeiras.
  • A determinação da integridade não leva em conta métricas como a fração de nulos, valores zero ou NaN.

Detecção de anomalias herdada

As seções a seguir abrangem dois recursos herdados: o painel de qualidade de dados e a configuração do trabalho de detecção de anomalias. A versão atual da detecção de anomalias não inclui esses recursos. O painel de controle foi substituído pela interface do usuário dos resultados do monitoramento da qualidade dos dados.

Painel de qualidade de dados (herdado)

Painel de qualidade de dados (herdado)

Observação

O painel de monitoramento de qualidade de dados estava disponível apenas para usuários legados. Na versão atual, use Exibir resultados do monitoramento de qualidade de dados na UI.

A primeira execução do monitor de qualidade de dados cria um painel para resumir resultados e tendências derivados da tabela de registro em log. O painel é preenchido automaticamente com insights para o esquema verificado. Um único painel é criado para cada workspace no seguinte caminho: /Shared/Databricks Quality Monitoring/Data Quality Monitoring.

Visão geral da qualidade

A guia Visão Geral da Qualidade mostra um resumo do status de qualidade mais recente das tabelas em seu esquema com base na avaliação mais recente.

Para começar, você deve inserir a tabela de log do esquema que deseja analisar para preencher o painel.

A seção superior do painel mostra uma visão geral dos resultados da verificação.

Resumo do esquema do monitor de qualidade de dados na guia Visão geral da qualidade do Painel.

Abaixo do resumo, há uma tabela que lista os incidentes de qualidade por impacto. Todas as causas raiz identificadas são exibidas na root_cause_analysis coluna.

Incidentes de qualidade por impacto na aba Visão Geral da Qualidade do Painel.

Abaixo da tabela de incidentes de qualidade está uma tabela de tabelas estáticas identificadas que não são atualizadas há muito tempo.

Definir parâmetros para avaliação de novidade e integridade (herdado)

Definir parâmetros para avaliação de atualidade e completude (herdado)

Observação

A partir de 21 de julho de 2025, não há suporte para a configuração dos parâmetros de trabalho para novos clientes. Se você precisar definir as configurações de trabalho, entre em contato com o Databricks.

Para editar os parâmetros que controlam o trabalho, como a frequência com que o trabalho é executado ou o nome da tabela de resultados registrados, você deve editar os parâmetros de trabalho na guia Tarefas da página de trabalho.

Página de empregos exibindo a tarefa de detecção de anomalias.

As seções a seguir descrevem configurações específicas. Para obter informações sobre como definir parâmetros de tarefa, consulte Configurar parâmetros de tarefa.

Agendamento e notificações (herdados)

Para personalizar o agendamento da tarefa ou configurar notificações, use as configurações de Agendamento e Disparadores na página de tarefas. Consulte Automatizando trabalhos com agendas e gatilhos.

Nome da tabela de registro em log (herdado)

Para alterar o nome da tabela de log ou salvar a tabela em um esquema diferente, edite o parâmetro logging_table_name da tarefa de trabalho e especifique o nome desejado. Para salvar a tabela de log em um esquema diferente, especifique o nome completo de 3 níveis.

Personalizar avaliações freshness e completeness (herdado)

Todos os parâmetros nesta seção são opcionais. Por padrão, a detecção de anomalias determina limites com base em uma análise do histórico da tabela.

Esses parâmetros são campos dentro do parâmetro metric_configsde tarefa. O formato de metric_configs é uma string JSON com os seguintes valores padrão:

[
  {
    "disable_check": false,
    "tables_to_skip": null,
    "tables_to_scan": null,
    "table_threshold_overrides": null,
    "table_latency_threshold_overrides": null,
    "static_table_threshold_override": null,
    "event_timestamp_col_names": null,
    "metric_type": "FreshnessConfig"
  },
  {
    "disable_check": true,
    "tables_to_skip": null,
    "tables_to_scan": null,
    "table_threshold_overrides": null,
    "metric_type": "CompletenessConfig"
  }
]

Os parâmetros a seguir podem ser usados para avaliações de freshness e completeness.

Nome do campo Descrição Exemplo
tables_to_scan Somente as tabelas especificadas são verificadas. ["table_to_scan", "another_table_to_scan"]
tables_to_skip As tabelas especificadas são ignoradas durante a verificação. ["table_to_skip"]
disable_check A verificação não foi executada. Use este parâmetro se você quiser desabilitar apenas a verificação freshness ou apenas a verificação completeness. true, false

Os seguintes parâmetros se aplicam somente à avaliação freshness.

Nome do campo Descrição Exemplo
event_timestamp_col_names Lista de tabelas de colunas de carimbo de data/hora que seu esquema pode ter. Se uma tabela tiver uma dessas colunas, ela será marcada Unhealthy se o valor máximo dessa coluna for excedido. Usar esse parâmetro pode aumentar o tempo e o custo da avaliação. ["timestamp", "date"]
table_threshold_overrides Um dicionário que consiste em nomes de tabela e limites (em segundos) que especificam o intervalo máximo desde a última atualização da tabela antes de marcar uma tabela como Unhealthy. {"table_0": 86400}
table_latency_threshold_overrides Um dicionário que consiste em nomes de tabela e limites de latência (em segundos) que especificam o intervalo máximo desde o último carimbo de data/hora na tabela antes de marcar uma tabela como Unhealthy. {"table_1": 3600}
static_table_threshold_override Tempo (em segundos) antes que uma tabela seja considerada como uma tabela estática (ou seja, uma que não seja mais atualizada). 2592000

Os seguintes parâmetros se aplicam apenas à avaliação de completeness:

Nome do campo Descrição Exemplo
table_threshold_overrides Um dicionário que consiste em nomes de tabela e limites de volume de linha (especificados como inteiros). Se o número de linhas adicionadas a uma tabela nas 24 horas anteriores for menor que o limite especificado, a tabela será marcada Unhealthy. {"table_0": 1000}