Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
Gestor de Tráfego do Azure é um balanceador de carga de tráfego baseado em DNS que distribui o tráfego de forma ótima entre backends distribuídos globalmente. O Traffic Manager proporciona alta disponibilidade e rapidez de resposta para as suas aplicações públicas, utilizando DNS para direcionar pedidos de clientes para endpoints de serviço apropriados, com base em métodos de encaminhamento de tráfego e monitorização do estado do endpoint.
Quando você usa o Azure, a confiabilidade é uma responsabilidade compartilhada. A Microsoft fornece uma variedade de recursos para oferecer suporte à resiliência e à recuperação. Você é responsável por entender como esses recursos funcionam em todos os serviços que você usa e selecionar os recursos necessários para atender aos seus objetivos de negócios e metas de tempo de atividade.
Este artigo descreve as capacidades de fiabilidade do Gestor de Tráfego do Azure em resposta a uma série de potenciais falhas, incluindo falhas transitórias e falhas regionais. Destaca também considerações-chave para manter a resiliência e preparar a recuperação, e fornece uma visão geral do acordo de nível de serviço (SLA) do Gestor de Tráfego do Azure.
Note
Este artigo descreve como o serviço Traffic Manager é resiliente, ou como pode torná-lo resiliente, face a vários problemas. Não explica como usar o Traffic Manager para realizar failover entre aplicações ou regiões. Para um exemplo de arquitetura de failover, consulte a aplicação web multinível construída para alta disponibilidade e recuperação de desastres.
Recomendações de implantação de produção
O Azure Well-Architected Framework fornece recomendações para fiabilidade, desempenho, segurança, custo e operações. Para saber como estas áreas se influenciam mutuamente e contribuem para uma solução fiável de Traffic Manager, consulte as melhores práticas de arquitetura para Gestor de Tráfego do Azure no Well-Architected Framework.
Visão geral da arquitetura de confiabilidade
Esta secção descreve alguns dos aspetos importantes do funcionamento do serviço que são mais relevantes do ponto de vista da fiabilidade. A secção apresenta a arquitetura lógica, que inclui alguns dos recursos e funcionalidades que implementa e utiliza. Também discute a arquitetura física, detalhando como o serviço funciona nos bastidores.
Arquitetura lógica
Quando usa o Traffic Manager, implementa um perfil que especifica os endpoints back-end da sua aplicação e configura como o Traffic Manager deve encaminhar os pedidos para esses endpoints. Para mais informações, consulte terminais do Gestor de Tráfego e métodos de encaminhamento do Gestor de Tráfego.
Um perfil do Gestor de Tráfego apresenta-se como um registo DNS CNAME. Quando recebe um pedido de resolução de um cliente ou de um resolvedor DNS, o Traffic Manager resolve dinamicamente o endereço IP com base nas regras que especifica no perfil. A responsabilidade do Traffic Manager é fornecer aos clientes o endereço IP de um endpoint para aceder ao seu serviço. Após a resolução do nome, nenhum tráfego da sua aplicação passa pelo Gestor de Tráfego. Para mais informações, consulte Como Funciona o Gestor de Tráfego.
O Traffic Manager monitoriza a saúde dos seus endpoints e encaminha os pedidos recebidos para endpoints saudáveis, evitando endpoints não saudáveis. Para mais informações, consulte monitoração de endpoints do Traffic Manager.
Importante
A fiabilidade da sua solução global depende da configuração dos endpoints para onde o gestor de tráfego encaminha o tráfego.
Este artigo não aborda os seus endpoints, mas as suas configurações de disponibilidade afetam diretamente a resiliência da sua aplicação. Consulte os guias de fiabilidade para serviços Azure na sua solução para saber como cada serviço suporta os seus requisitos de fiabilidade.
Arquitetura física
O Traffic Manager opera como um serviço não regional e implementa a sua infraestrutura em múltiplas zonas de disponibilidade em várias regiões do Azure em todo o mundo. Este design permite ao Gestor de Tráfego manter-se resiliente durante uma interrupção de zona de disponibilidade ou região, porque a infraestrutura noutra zona ou região continua a responder a pedidos de resolução.
Protocolos globais de internet como Anycast, DNS e BGP encaminham automaticamente os pedidos de resolução DNS para a infraestrutura saudável do Traffic Manager mais próxima.
Resiliência a falhas transitórias
Falhas transitórias são falhas curtas e intermitentes em componentes. Eles ocorrem com frequência em um ambiente distribuído, como a nuvem, e são uma parte normal das operações. As falhas transitórias corrigem-se após um curto período de tempo. É importante que seus aplicativos possam lidar com falhas transitórias, geralmente tentando novamente as solicitações afetadas.
Todos os aplicativos hospedados na nuvem devem seguir as diretrizes de tratamento de falhas transitórias do Azure quando se comunicam com quaisquer APIs, bancos de dados e outros componentes hospedados na nuvem. Para obter mais informações, consulte Recomendações para o tratamento de falhas transitórias.
O Traffic Manager opera ao nível DNS e utiliza sondas de saúde para monitorizar a disponibilidade dos endpoints. O serviço lida com falhas transitórias através da sua infraestrutura DNS global e capacidades de monitorização de endpoints.
Quando usar o Gestor de Tráfego, considere separadamente os seguintes tipos de falhas transitórias:
Falhas transitórias durante a resolução DNS: Se ocorrer uma falha transitória durante a resolução DNS, o cliente ou o resolvedor intermédio deve tentar novamente.
Falhas transitórias que afetam os seus endpoints back-end:A monitorização dos endpoints do Traffic Manager verifica regularmente a saúde dos seus endpoints. Uma falha transitória dentro de um endpoint, ou no caminho da rede para um endpoint, pode ser detetada como um endpoint não saudável. Configure a monitorização de endpoints para procurar problemas consecutivos ao longo de um período de tempo.
O tempo de vida (TTL) do seu registo DNS determina como a sua solução lida com falhas. Se o TTL for muito baixo, os clientes precisam de fazer mais pedidos ao Traffic Manager e há mais oportunidades potenciais para surgirem falhas transitórias. Se o TTL for muito elevado, no caso de uma falha verdadeira num endpoint, os clientes podem experienciar atrasos no failover até o TTL expirar. Configure os TTLs cuidadosamente para equilibrar disponibilidade, latência e capacidade de resposta. Quando usa o DNS do Azure, pode configurar automaticamente o TTL do seu registo para corresponder ao valor TTL do perfil, que é 60 segundos por defeito. Para obter mais informações, consulte Considerações de desempenho para o Gerenciador de Tráfego.
Resiliência a falhas na zona de disponibilidade
Zonas de disponibilidade são grupos fisicamente separados de centros de dados dentro de uma região Azure. Quando uma zona falha, os serviços podem ser transferidos para uma das zonas restantes.
O Traffic Manager opera como um serviço não regional e implementa a sua infraestrutura em múltiplas zonas de disponibilidade em várias regiões do Azure em todo o mundo. Replica as alterações no seu perfil de forma síncrona entre estas zonas e regiões. Este design permite que o Gestor de Tráfego se mantenha resiliente durante uma interrupção de zona de disponibilidade, porque a infraestrutura noutra zona ou região continua a responder a pedidos de resolução.
Resiliência a falhas em toda a região
O Traffic Manager opera como um serviço não regional e implementa a sua infraestrutura em múltiplas zonas de disponibilidade em várias regiões do Azure em todo o mundo. Este design permite que o Gestor de Tráfego se mantenha resiliente durante uma interrupção regional, porque a infraestrutura noutra zona ou região continua a responder a pedidos de resolução.
Resiliência face a falhas de portais e ferramentas de gestão
Se gerir o seu perfil do Gestor de Tráfego no portal do Azure, prepare-se para cenários em que não o consiga aceder, especialmente se precisar de reconfigurar o seu perfil durante uma falha na plataforma.
Tal como outros serviços do Azure, o Traffic Manager suporta a implementação e gestão através de várias ferramentas. Recomendamos que se familiarize com a forma de usar CLI do Azure ou Azure PowerShell para gerir o seu perfil. Alternativamente, implemente e configure o seu perfil usando tecnologias de infraestrutura como código como Bicep ou Terraform. Estas ferramentas mantêm-se operacionais mesmo que o portal Azure esteja degradado.
Backup e restauração
O Traffic Manager é um serviço DNS sem estado. Não persiste os teus dados e não tem capacidade de backup ou restauro.
Para proteger a configuração dos seus recursos, defina os seus perfis do Traffic Manager e outros recursos usando a infraestrutura como código (como modelos Bicep ou ARM) e armazene essas definições no controlo de versão. Se precisares de recriar um recurso, reimplementa-o a partir da configuração armazenada.
Resiliência à manutenção de serviços
A Microsoft aplica regularmente atualizações de serviço e realiza outras manutenções. A plataforma Azure gere estas atividades automaticamente, garantindo que a manutenção é fluida e transparente para si. Não é esperado qualquer tempo de indisponibilidade durante os eventos de manutenção, a menos que tenha sido informado através da manutenção planeada do Azure Service Health.
Contrato de nível de serviço
O contrato de nível de serviço (SLA) para serviços do Azure descreve a disponibilidade esperada de cada serviço e as condições que sua solução deve atender para atingir essa expectativa de disponibilidade. Para mais informações, consulte Acordos de Nível de Serviço (SLA) para serviços online.
Gestor de Tráfego do Azure fornece um SLA de disponibilidade de 100% para respostas a consultas DNS, desde que os clientes tentem repetidamente pedidos falhados.