Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Azure Elastic SAN é um serviço de rede de armazenamento nativo na cloud (SAN) que oferece uma solução de armazenamento escalável, económica, de alto desempenho e abrangente para uma variedade de opções de computação. O Elastic SAN permite-lhe criar e gerir volumes, que são discos virtuais que pode ligar às suas máquinas virtuais, contentores ou outros serviços do Azure através do protocolo iSCSI.
Quando você usa o Azure, a confiabilidade é uma responsabilidade compartilhada. A Microsoft fornece uma variedade de recursos para oferecer suporte à resiliência e à recuperação. Você é responsável por entender como esses recursos funcionam em todos os serviços que você usa e selecionar os recursos necessários para atender aos seus objetivos de negócios e metas de tempo de atividade.
Este artigo descreve como tornar o Azure Elastic SAN resiliente a uma variedade de potenciais falhas e problemas, incluindo falhas transitórias, falhas em zonas de disponibilidade e falhas regionais. Descreve também as opções de backup e recuperação, e destaca informações essenciais sobre o acordo de nível de serviço (SLA) do Azure Elastic SAN.
Recomendações de implantação de produção para confiabilidade
Para cargas de trabalho de produção, recomendamos que:
- Use armazenamento redundante por zonas (ZRS): O ZRS distribui cópias dos seus dados por três zonas de disponibilidade.
- Configure o seu acesso à rede para reduzir intervenções manuais durante falhas de zona: Endpoints privados permitem failover automático de zona sem intervenção manual, enquanto os endpoints de serviço podem necessitar de intervenção manual.
- Para cargas de trabalho que requerem recuperação de desastres entre regiões: Crie snapshots dos seus volumes regularmente e exporte-os para snapshots de disco geridos para proteção de dados. Copia os snapshots para uma região secundária que esteja geograficamente distante da tua região principal.
Visão geral da arquitetura de confiabilidade
O Elastic SAN tem uma hierarquia de recursos de três níveis:
- Elastic SAN: O recurso de topo onde configura redundância, aloca capacidade de armazenamento e define limites de desempenho. O número de unidades base atribuídas ao seu Elastic SAN determina o total de IOPS e a largura de banda disponível em toda a SAN.
- Grupos de volumes: Construtos de gestão usados para gerir volumes em grande escala. As definições de acesso à rede, como endpoints privados ou endpoints de serviço, são configuradas ao nível do grupo de volumes e herdadas por todos os volumes do grupo.
- Volumes: Volumes de armazenamento individuais particionados da capacidade total da SAN. Os volumes estão ligados aos recursos de computação através do protocolo iSCSI.
Para mais detalhes sobre os recursos que implementa, consulte Recursos Elastic SAN.
Internamente, o Elastic SAN armazena os seus dados dentro de clusters de armazenamento. Quando configura o seu SAN Elastic para usar armazenamento localmente redundante (LRS), os seus dados são replicados três vezes dentro de um único cluster de armazenamento num só centro de dados. Pode configurar o armazenamento redundante por zonas (ZRS) para armazenar cópias dos dados em três zonas de disponibilidade. Para mais informações, veja Resiliência a falhas em zonas de disponibilidade.
Resiliência a falhas transitórias
Falhas transitórias são falhas curtas e intermitentes em componentes. Eles ocorrem com frequência em um ambiente distribuído, como a nuvem, e são uma parte normal das operações. As falhas transitórias corrigem-se após um curto período de tempo. É importante que seus aplicativos possam lidar com falhas transitórias, geralmente tentando novamente as solicitações afetadas.
Todos os aplicativos hospedados na nuvem devem seguir as diretrizes de tratamento de falhas transitórias do Azure quando se comunicam com quaisquer APIs, bancos de dados e outros componentes hospedados na nuvem. Para obter mais informações, consulte Recomendações para o tratamento de falhas transitórias.
Se a sua ligação iSCSI a um volume Elastic SAN for interrompida, o iniciador iSCSI no cliente tenta automaticamente reconectar-se. Pode experienciar uma breve pausa nas operações de I/O durante a religação. Configure o seu iniciador iSCSI com as definições adequadas de nova tentativa e limite de tempo para gerir interrupções transitórias. Para recomendações detalhadas de definições de iSCSI e MPIO, consulte Otimizar o desempenho do seu SAN Elastic.
Resiliência a falhas na zona de disponibilidade
As zonas de disponibilidade são grupos fisicamente separados de centros de dados dentro de uma região Azure. Quando uma zona falha, os serviços podem ser transferidos para uma das zonas restantes.
O Azure Elastic SAN pode ser configurado para usar armazenamento redundante por zonas (ZRS), o que significa que os seus dados são replicados de forma síncrona em três zonas de disponibilidade na região. A redundância de zonas ajuda-o a alcançar resiliência e fiabilidade para as suas cargas de trabalho em produção.
A sua abordagem de conectividade afeta a capacidade da carga de trabalho de fazer failover de forma transparente durante uma falha de zona. Recomendamos usar endpoints privados para conectar aos seus volumes. Endpoints privados suportam alternância automática em caso de falha. Se usar endpoints de serviço, o failover pode exigir intervenção manual. Para mais informações sobre as abordagens de conectividade, consulte Aprenda sobre configurações de rede para Elastic SAN.
Usar armazenamento localmente redundante (LRS) deixa o seu SAN Elastic desprotegido contra falhas na zona de disponibilidade. O LRS torna o Elastic SAN não zonal ao armazenar dados numa única zona de disponibilidade em vez de os distribuir entre zonas com ZRS.
Requisitos
Apoio regional: Os recursos Elastic SAN redundantes por zona podem ser implementados num subconjunto de regiões. Para obter uma lista de regiões, consulte Objetivos de escalonamento para SAN elástica.
Custo
Quando crias um SAN elástico com ZRS, o custo é mais alto do que no LRS. Para mais informações sobre preços, consulte Azure Elastic SAN preços.
Configurar o suporte à zona de disponibilidade
Crie um novo SAN elástico com ZRS: Quando crias uma SAN Elastic e selecionas ZRS como opção de redundância, a tua SAN Elastic fica automaticamente redundante em zona. Não podes alterar a opção de redundância depois de criado o SAN do Elastic. Para mais informações sobre a criação de um novo recurso Elastic SAN, consulte Deploy an Elastic SAN.
Ativar a redundância de zona num LRS Elastic SAN existente: Não se pode converter um SAN elástico LRS para ZRS no local. Para migrar, faça snapshots dos seus volumes Elastic SAN, exporte-os para snapshots de disco geridos, implemente um novo Elastic SAN no ZRS e depois crie volumes no novo Elastic SAN usando esses snapshots de disco. Para mais informações, consulte Snapshot Azure Elastic SAN volumes.
Comportamento quando todas as zonas estão íntegras
Esta secção descreve o que esperar quando configura um SAN Elastic para redundância de zonas, e todas as zonas estão operacionais.
Operação entre zonas: Quando se liga a um volume Elastic SAN, a sua ligação iSCSI encaminha para um cluster numa das zonas de disponibilidade. A plataforma encaminha automaticamente o tráfego entre zonas.
Replicação de dados entre zonas: Quando um cliente escreve dados num volume Elastic SAN, esses dados são escritos de forma síncrona em clusters dentro de três zonas de disponibilidade antes de a operação de escrita ser reconhecida. A replicação síncrona garante um elevado nível de consistência dos dados e assegura que não há perda de dados durante uma falha de zona.
A implantação de uma SAN elástica ZRS oferece mais confiabilidade do que uma SAN elástica LRS, mas adiciona mais latência de gravação. Faça um benchmark do seu Elastic SAN e simule a carga de trabalho do seu aplicativo para comparar a latência entre o LRS e o ZRS, para ver se isso afeta sua carga de trabalho.
Comportamento durante uma falha de zona
Esta secção descreve o que esperar quando configura um SAN Elastic para redundância de zonas, e há uma falha numa das zonas.
Deteção e resposta: A plataforma Elastic SAN deteta quaisquer falhas numa zona de disponibilidade. Não precisas de fazer nada para iniciar um failover de zona para os SANs elásticos ZRS.
Notificação: A Microsoft não o notifica automaticamente quando uma zona está inativa. No entanto, você pode usar a Integridade do Serviço do Azure para entender a integridade geral do serviço, incluindo quaisquer falhas de zona, e pode configurar alertas de Integridade do Serviço para notificá-lo sobre problemas.
Pedidos ativos: Quando uma zona de disponibilidade se torna indisponível, o serviço pode terminar operações de E/S em curso que se ligam a réplicas na zona afetada, e deve tentar novamente essas operações. Se usares endpoints privados, o serviço faz failover automaticamente. Se utilizar endpoints de serviço, poderá ser necessário reiniciar o iniciador iSCSI para mudar automaticamente para uma zona em bom estado.
Perda de dados esperada: O SAN elástico previne a perda de dados durante uma falha de zona ao replicar os dados de forma síncrona entre três zonas de disponibilidade.
Tempo de inatividade previsto: Quando usas endpoints privados, o failover de zona acontece automaticamente. Pode experienciar disponibilidade e degradação de desempenho durante alguns minutos após um failover enquanto o SAN se reequilibra.
Quando usas endpoints de serviço, o Elastic SAN não muda automaticamente para uma zona saudável. Talvez seja necessário reiniciar o iniciador iSCSI para dar início a uma operação de failover para uma zona diferente e saudável.
Redirecionamento de tráfego: Quando uma zona não está disponível, a plataforma Elastic SAN deteta a perda da zona e encaminha o tráfego para as zonas restantes saudáveis.
Para garantir o failover automático da zona sem intervenção manual, utilize endpoints privados para ligar ao seu Elastic SAN. Quando usa endpoints de serviço em vez de endpoints privados, pode ser necessário reiniciar manualmente o iniciador iSCSI para iniciar um failover para uma zona saudável.
Recuperação de zona
Quando a zona de disponibilidade recupera, a plataforma Elastic SAN restaura automaticamente as operações normais e retoma a replicação em três zonas. Você não precisa tomar nenhuma medida.
Teste de falhas de zona
A plataforma Azure Elastic SAN gere o encaminhamento de tráfego, failover e recuperação de zonas para recursos redundantes de zona. Como esse recurso é totalmente gerenciado, não é necessário validar os processos de falha da zona de disponibilidade.
Resiliência a falhas em toda a região
Azure Elastic SAN é um serviço de região única. Se a região ficar indisponível, o seu recurso Elastic SAN também fica indisponível. Não existe replicação ou failover entre regiões incorporado para o Elastic SAN. É responsável por arquitetar a sua própria solução de recuperação de desastres multi-região se a sua carga de trabalho exigir resiliência a nível regional.
Soluções personalizadas de várias regiões para resiliência
És responsável por implementar a recuperação de desastres multi-região para os teus dados Elastic SAN. A abordagem recomendada é usar instantâneos de volume:
Cria snapshots regularmente. Use snapshots de volume para capturar cópias em momento real dos seus volumes Elastic SAN.
O objetivo do teu ponto de recuperação (RPO) depende da frequência com que crias e copias snapshots para a região secundária. Quanto mais frequentemente criar instantâneos e copiá-los, menor será a sua potencial perda de dados durante um desastre.
Exportar snapshots para snapshots de disco geridos.Exporte os seus snapshots de volume para snapshots de disco geridos, que podem ser copiados para outras regiões.
Copie os snapshots para uma região secundária.Copie o snapshot incremental para uma nova região que esteja geograficamente distante da sua região principal. Isto reduz o risco de múltiplas regiões serem afetadas por um único desastre.
Restaurar a partir de snapshots. Num cenário de recuperação de desastres, crie novos volumes no Elastic SAN secundário a partir dos snapshots de discos geridos copiados.
O seu objetivo de tempo de recuperação (RTO) depende do tamanho dos seus dados, do tempo que demora a copiar snapshots entre regiões e do tempo necessário para implementar e configurar um novo SAN Elastic na região secundária. Para reduzir o tempo de recuperação, considere implantar um SAN Elástico secundário na sua região de recuperação antes de ocorrer um desastre. Isto também ajuda a evitar limitações de capacidade durante uma interrupção.
Backup e restauração
Para a maioria das soluções, você não deve confiar exclusivamente em backups. Em vez disso, use os outros recursos descritos neste guia para dar suporte aos seus requisitos de resiliência. No entanto, os backups protegem contra alguns riscos que outras abordagens não oferecem. Para obter mais informações, consulte O que são redundância, replicação e backup?.
O SAN elástico suporta dois tipos de backup:
Azure Elastic SAN backup: Esta capacidade de Azure Backup oferece uma solução totalmente gerida para agendar backups, definir prazos de expiração para pontos de recuperação e dados de recuperação para um novo volume. Ele ajuda a proteger contra a perda de dados de exclusões acidentais, ransomware e atualizações de aplicativos. Para mais informações, consulte Azure Elastic SAN backup (pré-visualização).
Importante
Como esta solução é abrangida pelos Termos Suplementares da Microsoft para Pré-visualizações do Azure, utilize-a para teste e não para utilização em produção.
Instantâneos: Em alternativa, pode criar e gerir instantâneos com base nos seus requisitos de proteção de dados.
O Azure Elastic SAN suporta snapshots de volume para proteção de dados. Os snapshots são cópias incrementais, num ponto no tempo, dos seus volumes que consomem espaço a partir da capacidade total do seu SAN Elastic. Para proteger os seus dados, crie snapshots regularmente. A frequência depende da quantidade de dados que pode tolerar perder (o seu RPO - Objetivo de Ponto de Recuperação). Pode criar snapshots manualmente ou criar a sua própria automação para os criar num calendário.
Os instantâneos são armazenados no mesmo Elastic SAN que os seus volumes e usam a mesma configuração de redundância. Para se proteger contra falhas abrangentes em toda a região, exporte os seus instantâneos para instantâneos de discos geridos e copie-os para uma região diferente. Para mais informações, consulte Exportar snapshot de volume e Copiar um snapshot incremental para uma nova região.
Pode criar um novo volume Elastic SAN a partir de um snapshot ou de um snapshot de disco gerido. Para obter mais informações, consulte Criar um volume a partir de um instantâneo.
Resiliência à manutenção de serviços
A Microsoft aplica regularmente atualizações de serviço e realiza outras manutenções. A plataforma Azure gere estas atividades automaticamente, garantindo que a manutenção é fluida e transparente para si. Não é esperado qualquer tempo de indisponibilidade durante os eventos de manutenção, a menos que tenha sido informado através da manutenção planeada do Azure Service Health.
Contrato de nível de serviço
O contrato de nível de serviço (SLA) para serviços do Azure descreve a disponibilidade esperada de cada serviço e as condições que sua solução deve atender para atingir essa expectativa de disponibilidade. Para mais informações, consulte Acordos de Nível de Serviço (SLA) para serviços online.