Referência para desenvolvedores de pipeline

Implemente o carregamento de dados e as transformações de dados nos pipelines declarativos do Lakeflow Spark com consultas que definem tabelas de streaming e vistas materializadas. O Lakeflow Spark Declarative Pipelines suporta interfaces SQL e Python. Como oferecem funcionalidades equivalentes para a maioria dos casos de processamento de dados, pode escolher a interface com que se sentir mais confortável. Para ajuda a decidir, veja Escolher entre SQL e Python.

Desenvolvimento em Python

Criar pipelines usando código Python.

Tópico	Description
Desenvolver código de pipeline com Python	Uma visão geral do desenvolvimento de pipelines em Python.
Lakeflow Spark Declarative Pipelines Python referência de linguagem	Documentação de referência do Python para o módulo `pipelines`.
Gerir dependências do Python para pipelines	Instruções para gerir bibliotecas Python em pipelines.
Importar módulos Python de pastas Git ou ficheiros de espaço de trabalho	Instruções para usar módulos Python que tem armazenados no Azure Databricks.

Desenvolvimento SQL

Crie pipelines usando código SQL.

Tópico	Description
Desenvolver código Lakeflow Spark Declarative Pipelines com SQL	Uma visão geral do desenvolvimento de pipelines em SQL.
Referência da linguagem SQL do pipeline	Documentação de referência para sintaxe SQL para Lakeflow Spark Declarative Pipelines.
Pipelines autónomos	Use o Databricks SQL para trabalhar com pipelines.

Outros tópicos de desenvolvimento

Os tópicos seguintes descrevem outras formas de desenvolver pipelines.

Tópico	Description
Converter um pipeline num projeto de bundle	Converta um pipeline existente em um pacote, que permite gerenciar sua configuração de processamento de dados em um arquivo YAML controlado pela fonte para facilitar a manutenção e implantações automatizadas em ambientes de destino.
Metaprogramação com Pipelines Declarativos do Lakeflow Spark	Cria pipelines com dlt-meta. Use a biblioteca open source `dlt-meta` para automatizar a criação de pipelines com um framework orientado por metadados. Tutorial: Crie múltiplos fluxos com parâmetros diferentes. Crie múltiplos fluxos num ciclo em Python.
Desenvolva código de pipeline em seu ambiente de desenvolvimento local	Uma visão geral das opções para o desenvolvimento de pipelines localmente.

Comentários

Esta página foi útil?

Last updated on 2026-06-23