Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
O Lakebase baseia-se num conjunto de funcionalidades que lhe permitem desenvolver, testar e escalar as suas aplicações de base de dados de forma eficiente. Esta secção apresenta os conceitos centrais que diferenciam o Lakebase dos sistemas tradicionais de bases de dados.
Projetos
Um projeto Lakebase é o contentor de topo para todos os seus recursos de base de dados. Cada projeto pertence a um espaço de trabalho do Azure Databricks e contém uma ou mais ramificações, cada uma com a sua própria computação e bases de dados.
Project
└── Branch (e.g., production)
├── Compute (read-write)
└── Database (e.g., databricks_postgres)
Saiba mais: Projetos | Gerir projetos
Autoscaling
O Lakebase ajusta automaticamente os recursos computacionais com base nas exigências da sua carga de trabalho. À medida que o tráfego da sua aplicação aumenta ou diminui, os recursos computacionais aumentam ou diminuem dentro do intervalo configurado sem intervenção manual ou tempo de inatividade.
Principais benefícios:
- Ajuste automático: Os recursos escalam com base na procura real.
- Sem tempo de inatividade: O escalonamento dentro do intervalo configurado acontece sem interromper ligações. No entanto, alterar a configuração mínima ou máxima da CU pode causar uma breve interrupção.
- Otimização de custos: Pague apenas pelos recursos que realmente utiliza.
- Consistência de desempenho: Mantenha um desempenho responsivo durante picos de tráfego.
Saiba mais: Autoscaling | Configurar autoscaling
Escalonar para zero
Quando a sua base de dados está inativa, a Lakebase pode escalar automaticamente os recursos computacionais para zero, eliminando custos de capacidade não utilizada. Quando a atividade recomeça, a sua computação redimensiona automaticamente em questão de segundos.
Principais benefícios:
- Custos de repouso zero: Não há custos de computação quando a sua base de dados está inativa.
- Retomar instantâneo: As bases de dados despertam automaticamente quando acedidas.
- Favorável ao desenvolvimento: Ideal para ambientes de desenvolvimento e staging com uso intermitente.
- Gestão automática: Não é necessária intervenção manual.
Saiba mais: Escalar até zero | Configurar escala até zero
Ramos de bases de dados
As branches da base de dados no Lakebase funcionam de forma semelhante às branches Git para o seu código. Pode criar ramificações instantâneas e isoladas para desenvolvimento, teste ou experimentação sem duplicar dados ou afetar o seu ambiente de produção.
Principais benefícios:
- Criação instantânea: As ramificações são criadas em segundos usando tecnologia de copiar e escrever.
- Eficiente em termos de custos: Apenas os dados modificados são armazenados separadamente, minimizando os custos de armazenamento.
- Ambientes isolados: Testa as alterações de forma segura sem afetar a tua base de dados principal.
- Colaboração: Os membros da equipa podem trabalhar em ramos separados em simultâneo.
Saiba mais: Ramos de dados | Gerir ramos
Cálculos e terminais
Um endpoint Lakebase é o ponto de ligação estável que a sua aplicação utiliza para aceder a uma base de dados. Por trás de cada endpoint, uma ou mais instâncias de computação tratam do processamento de consultas. A tua cadeia de ligação mantém-se igual mesmo enquanto escalas recursos de computação ou adicionas alta disponibilidade.
Uma ramificação tem normalmente um endpoint de leitura e escrita (a sua instância de computação principal) e, opcionalmente, um ou mais endpoints apenas de leitura (réplicas de leitura).
Saiba mais: Instâncias de computação e pontos de extremidade | Gerir instâncias de computação
Arquitetura de armazenamento
O Lakebase armazena dados numa camada de armazenamento distribuída que é separada da computação. O armazenamento é redundante por zonas e persiste independentemente do estado do cálculo, quer o cálculo esteja a correr, em pausa ou em failover. Esta separação de armazenamento permite ramificações instantâneas, réplicas de leitura e escala até zero sem duplicação de dados.
Principais benefícios:
- Armazenamento altamente disponível: O Azure Databricks mantém armazenamento altamente disponível independentemente da configuração de computação do seu HA.
- Persiste através de alterações de computação: O armazenamento mantém-se disponível devido a falhas de cálculo, pausas ou alterações de configuração.
- Base para branches e réplicas: Tanto a criação instantânea de branches como as réplicas de leitura assentam ambas em várias instâncias de processamento que partilham a mesma camada de armazenamento.
Saiba mais: Arquitetura de armazenamento
Alta disponibilidade
Alta disponibilidade combina um cálculo primário de leitura/escrita com uma ou mais instâncias secundárias distribuídas por zonas de disponibilidade. Quando o primário fica indisponível, o Lakebase promove automaticamente um secundário e a aplicação continua a partir da última transação confirmada. A sua cadeia de ligação mantém-se inalterada ao longo de todo o processo. O armazenamento já tem alta disponibilidade. Ativar o HA adiciona redundância ao nível de computação para failover automático.
Principais benefícios:
- Failover automático: O Lakebase promove uma instância de computação secundária sem intervenção manual.
- Sem perda de dados: O failover preserva todas as transações comprometidas.
- Cadeias de ligação estáveis: A sua aplicação não precisa de alterar a configuração da ligação após um failover.
Saiba mais: Alta disponibilidade | Gerir alta disponibilidade
Réplicas de leitura
Réplicas de leitura são unidades de processamento independentes somente para leitura que executam operações de leitura sobre os mesmos dados da sua unidade de processamento principal de leitura-escrita. Ao contrário das réplicas tradicionais, as réplicas de leitura do Lakebase não duplicam dados — leem a partir da mesma camada de armazenamento, permitindo a criação instantânea e eliminando custos adicionais de armazenamento.
Principais benefícios:
- Escala horizontal: Distribuir pedidos de leitura entre múltiplas réplicas.
- Sem duplicação de dados: Todas as réplicas são lidas a partir do mesmo armazenamento.
- Criação instantânea: Disponível em segundos sem cópia de dados.
- Eficiente em termos de custos: Sem custos adicionais de armazenamento, além de autoscaling e suporte para escalar até zero.
Saiba mais: Ler réplicas | Gerir ler réplicas
Como trabalham juntos
Estes conceitos centrais trabalham em conjunto para criar uma plataforma de base de dados poderosa e flexível:
- Os projetos organizam todos os seus recursos de base de dados e pertencem a um espaço de trabalho do Azure Databricks.
- O dimensionamento automático garante que cada ramificação dispõe da quantidade certa de capacidade de computação consoante a procura.
- Escalonamento para zero reduz os custos em ramos inativos ao suspender os recursos de computação quando não estão a ser utilizados.
- As ramificações da base de dados permitem criar ambientes isolados para desenvolvimento e testes sem duplicar dados.
- Os computadores e os endpoints fornecem pontos de ligação estáveis à medida que escalas ou reconfiguras a tua infraestrutura.
- A arquitetura de armazenamento mantém os seus dados com redundância entre zonas e altamente disponíveis, independentemente do estado da computação.
- Alta disponibilidade adiciona redundância ao nível da computação e comutação automática em caso de falha entre zonas de disponibilidade para cargas de trabalho de produção.
- As réplicas de leitura distribuem o tráfego de leitura entre instâncias de computação adicionais.
Esta arquitetura permite-lhe construir e escalar aplicações de bases de dados com maior flexibilidade, custos mais baixos e menos sobrecarga operacional do que os sistemas tradicionais de bases de dados.