Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Neste tutorial, crias um pipeline para mover dados OData de uma fonte Northwind para um destino lakehouse e envias uma notificação por e-mail quando o pipeline é concluído.
Pré-requisitos
Para começar, você deve preencher os seguintes pré-requisitos:
- Certifica-te de que tens um espaço de trabalho com Microsoft Fabric que não seja o My Workspace predefinido.
Criar uma casa no lago
Para começar, primeiro você precisa criar uma casa no lago. Um lakehouse é um data lake otimizado para análises. Neste tutorial, você cria uma casa de lago que é usada como destino para o fluxo de dados.
Acede ao teu espaço de trabalho compatível com o Fabric.
Selecione Lakehouse no menu de criação.
Insira um Nome para a casa do lago.
Selecione Criar.
Agora você criou uma casa de lago e agora pode configurar o fluxo de dados.
Criar um fluxo de dados
Um fluxo de dados é uma transformação de dados reutilizável que pode ser usada num pipeline. Neste tutorial, você cria um fluxo de dados que obtém dados de uma fonte OData e grava os dados em um destino lakehouse.
Aceda ao seu espaço de trabalho com o Fabric ativado.
Selecione Dataflow Gen2 no menu criar.
Ingerir os dados da fonte OData.
Selecione Obter dados e, em seguida, selecione Mais.
Em Escolher fonte de dados, procure OData e selecione o conector OData.
Insira a URL da fonte OData. Para este tutorial, use o serviço de exemplo OData.
Selecione Seguinte.
Selecione a Entidade que pretende ingerir. Neste tutorial, use a entidade Orders.
Selecione Criar.
Agora que você ingeriu os dados da fonte OData, você pode configurar o destino lakehouse.
Para ingerir dados no destino lakehouse:
Selecione Adicionar destino de dados.
Selecione Lakehouse.
Configure a conexão que você deseja usar para se conectar à casa do lago. As configurações padrão são boas.
Selecione Seguinte.
Navegue até o espaço de trabalho onde você criou a casa do lago.
Selecione a casa do lago que você criou nas etapas anteriores.
Confirme o nome da tabela.
Selecione Seguinte.
Confirme o método de atualização e selecione Salvar configurações.
Publique o fluxo de dados.
Importante
Quando o primeiro Dataflow Gen2 é criado num espaço de trabalho, os itens Lakehouse e Warehouse são aprovisionados juntamente com o respetivo ponto final de análise SQL e os respetivos modelos semânticos. Esses itens são compartilhados por todos os fluxos de dados no espaço de trabalho e são necessários para que o Dataflow Gen2 funcione, não devem ser excluídos e não se destinam a ser usados diretamente pelos usuários. Os itens são um detalhe de implementação do Dataflow Gen2. Os itens não são visíveis no espaço de trabalho, mas podem ser acessíveis em outras experiências, como as experiências Notebook, SQL-endpoint, Lakehouse e Warehouse. Você pode reconhecer os itens por seu prefixo no nome. O prefixo dos itens é 'DataflowsStaging'.
Agora que você ingeriu os dados para o destino lakehouse, você pode configurar seu pipeline.
Criar uma canalização
Um pipeline é um fluxo de trabalho que pode ser usado para automatizar o processamento de dados. Neste tutorial, você cria um pipeline que executa o Dataflow Gen2 criado no procedimento anterior.
Navegue de volta para a página de visão geral do espaço de trabalho e selecione Pipelines no menu criar.
Forneça um Nome para o pipeline.
Selecione a atividade Fluxo de dados.
Selecione o Dataflow que criou no procedimento anterior na lista pendente Dataflow, em Definições.
Adicione uma atividade do Office 365 Outlook .
Configure a atividade do Office 365 Outlook para enviar notificações por email.
Executar e agendar o fluxo de trabalho
Nesta seção, você executa e agenda o pipeline.
Vá para a área de trabalho.
Abra o menu suspenso do pipeline que você criou no procedimento anterior e selecione Agendar.
Em Execução agendada, selecione Ativo.
Forneça o agendamento que você deseja usar para executar o pipeline.
- Repita, por exemplo, todos os dias ou todos os minutos.
- Quando selecionado Diariamente, você também pode selecionar a Hora.
- Comece em uma data específica.
- Terminar numa data específica.
- Selecione o fuso horário.
Selecione Aplicar para aplicar as alterações.
Agora criou um pipeline que é executado em horário programado, atualiza os dados no lakehouse e envia uma notificação por e-mail. Você pode verificar o status do pipeline acessando o Hub do Monitor. Você também pode verificar o estado do pipeline ao aceder a Pipeline e selecionar a guia Histórico de execução no menu suspenso.