Azure Traffic Manager의 안정성

Azure Traffic Manager는 전역적으로 분산된 백 엔드에 트래픽을 최적으로 분산하는 DNS 기반 트래픽 부하 분산 장치입니다. Traffic Manager는 DNS를 사용하여 트래픽 라우팅 방법 및 엔드포인트 상태 모니터링에 따라 클라이언트 요청을 적절한 서비스 엔드포인트로 전송하여 공용 애플리케이션에 대한 고가용성 및 빠른 응답성을 제공합니다.

Azure를 사용하는 경우 안정성은 공유 책임입니다. Microsoft는 복원력 및 복구를 지원하는 다양한 기능을 제공합니다. 이러한 기능이 사용하는 모든 서비스 내에서 작동하는 방식을 이해하고 비즈니스 목표 및 가동 시간 목표를 충족하는 데 필요한 기능을 선택할 책임이 있습니다.

이 문서에서는 일시적인 오류 및 지역 전체 오류를 포함하여 다양한 잠재적 중단에 대응하여 Azure Traffic Manager 안정성 기능을 설명합니다. 또한 복원력 유지 관리 및 복구 준비에 대한 주요 고려 사항을 강조하고 Azure Traffic Manager SLA(서비스 수준 계약)의 개요를 제공합니다.

비고

이 문서에서는 Traffic Manager 서비스의 복원력 또는 다양한 문제에 대한 복원력을 만드는 방법을 설명합니다. Traffic Manager를 사용하여 애플리케이션 또는 지역 간에 장애 조치(failover)를 수행하는 방법은 설명하지 않습니다. 장애 조치 아키텍처의 예시로는 고가용성과 재해 복구를 위해 구축된 Multitier 웹 애플리케이션을 참조하세요.

프로덕션 배포 권장 사항

Azure Well-Architected Framework는 안정성, 성능, 보안, 비용 및 운영에 대한 권장 사항을 제공합니다. 이러한 영역이 서로 영향을 미치고 신뢰할 수 있는 Traffic Manager 솔루션에 기여하는 방법을 알아보려면 Well-Architected Framework Azure Traffic Manager 대한Architecture 모범 사례를 참조하세요.

안정성 아키텍처 개요

이 섹션에서는 안정성 관점에서 가장 관련성이 높은 서비스가 작동하는 방식의 몇 가지 중요한 측면을 설명합니다. 이 섹션에서는 배포하고 사용하는 일부 리소스 및 기능을 포함하는 논리 아키텍처를 소개합니다. 또한 서비스의 작동 방식에 대한 세부 정보를 제공하는 물리적 아키텍처에 대해서도 설명합니다.

논리 아키텍처

Traffic Manager를 사용하는 경우 애플리케이션의 백 엔드 엔드포인트를 지정하고 Traffic Manager가 요청을 해당 엔드포인트로 라우팅하는 방법을 구성하는 프로필을 배포합니다. 자세한 내용은 Traffic Manager 엔드포인트 및Traffic Manager 라우팅 방법을 참조하세요.

Traffic Manager 프로필은 DNS CNAME 레코드로 표시됩니다. 클라이언트 또는 DNS 확인자로부터 확인 요청을 받으면 Traffic Manager는 프로필에 지정한 규칙에 따라 IP 주소를 동적으로 확인합니다. Traffic Manager의 책임은 서비스에 연결할 엔드포인트의 IP 주소를 클라이언트에 제공하는 것입니다. 이름 확인 후에는 애플리케이션의 트래픽이 Traffic Manager를 통해 흐르지 않습니다. 자세한 내용은 Traffic Manager 작동 방식을 참조하세요.

Traffic Manager는 엔드포인트의 상태를 모니터링하고 비정상 엔드포인트를 피하면서 들어오는 요청을 정상 엔드포인트로 라우팅합니다. 자세한 내용은 Traffic Manager 엔드포인트 모니터링을 참조하세요.

Important

전체 솔루션의 안정성은 트래픽 관리자가 트래픽을 라우팅하는 엔드포인트의 구성에 따라 달라집니다.

이 문서에서는 엔드포인트를 다루지 않지만 해당 가용성 구성은 애플리케이션의 복원력에 직접적인 영향을 줍니다. 솔루션에서 Azure 서비스에 대한 안정성 가이드를 검토하여 각 서비스가 안정성 요구 사항을 지원하는 방법을 알아봅니다.

물리적 아키텍처

Traffic Manager는 비조직 서비스로 작동하며 전 세계 여러 Azure 지역의 여러 가용성 영역에 인프라를 배포합니다. 다른 영역 또는 지역의 인프라가 해결 요청에 계속 응답하기 때문에 이 디자인을 통해 Traffic Manager는 가용성 영역 또는 지역 중단 중에 복원력을 유지할 수 있습니다.

Anycast, DNS 및 BGP와 같은 글로벌 인터넷 프로토콜은 들어오는 DNS 확인 요청을 가장 가까운 정상 Traffic Manager 인프라로 자동으로 라우팅합니다.

일시적인 오류에 대한 복원력

일시적인 오류는 구성 요소에서 짧고 간헐적인 오류입니다. 클라우드와 같은 분산 환경에서 자주 발생하며 작업의 일반적인 부분입니다. 일시적인 오류는 짧은 시간 후에 스스로 수정됩니다. 애플리케이션은 일반적으로 영향을 받는 요청을 다시 시도하여 일시적인 오류를 처리할 수 있는 것이 중요합니다.

모든 클라우드 호스팅 애플리케이션은 클라우드 호스팅 API, 데이터베이스 및 기타 구성 요소와 통신할 때 Azure 임시 오류 처리 지침을 따라야 합니다. 자세한 내용은 임시 오류 처리를 위한 권장 사항을 참조하세요.

Traffic Manager는 DNS 수준에서 작동하며 상태 프로브를 사용하여 엔드포인트 가용성을 모니터링합니다. 서비스는 글로벌 DNS 인프라 및 엔드포인트 모니터링 기능을 통해 일시적인 오류를 처리합니다.

Traffic Manager를 사용하는 경우 다음과 같은 유형의 일시적인 오류를 별도로 고려합니다.

  • DNS 확인 중 일시적인 오류: DNS 확인 중에 일시적인 오류가 발생하는 경우 클라이언트 또는 중간 확인자는 다시 시도해야 합니다.

  • 백 엔드 엔드포인트에 영향을 주는 일시적인 오류:Traffic Manager 엔드포인트 모니터링 은 정기적으로 엔드포인트의 상태를 확인합니다. 엔드포인트 내부 또는 엔드포인트로의 네트워크 경로에서 발생한 일시적 오류는 해당 엔드포인트가 비정상 상태로 감지될 수 있습니다. 일정 기간 동안 연속된 문제를 찾으도록 엔드포인트 모니터링을 구성합니다.

DNS 레코드의 TTL(Time to Live)은 솔루션이 오류를 처리하는 방법을 결정합니다. TTL이 매우 낮은 경우 클라이언트는 Traffic Manager에 더 많은 요청을 수행해야 하며 일시적인 오류가 발생할 가능성이 더 큽니다. TTL이 매우 높은 경우 엔드포인트에서 실제 오류가 발생하는 경우 클라이언트는 TTL이 만료될 때까지 장애 조치(failover)가 지연될 수 있습니다. 가용성, 대기 시간 및 응답성의 균형을 맞추기 위해 TTL을 신중하게 구성합니다. Azure DNS 사용하면 기본적으로 60초인 프로필의 TTL 값과 일치하도록 레코드의 TTL을 자동으로 구성할 수 있습니다. 자세한 내용은 Traffic Manager 대한성능 고려 사항을 참조하세요.

가용성 영역 오류에 대한 복원력

가용성 영역은 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 전환될 수 있습니다.

Traffic Manager는 비조직 서비스로 작동하며 전 세계 여러 Azure 지역의 여러 가용성 영역에 인프라를 배포합니다. 이러한 영역 및 지역에 걸쳐 변경 내용을 프로필에 동기적으로 복제합니다. 이 디자인을 사용하면 다른 영역 또는 지역의 인프라가 해결 요청에 계속 응답하기 때문에 가용성 영역 중단 시 Traffic Manager가 복원력을 유지할 수 있습니다.

지역 전체 오류에 대한 복원력

Traffic Manager는 비조직 서비스로 작동하며 전 세계 여러 Azure 지역의 여러 가용성 영역에 인프라를 배포합니다. 다른 영역 또는 지역의 인프라가 해결 요청에 계속 응답하기 때문에 이 디자인을 통해 Traffic Manager는 지역 중단 시 복원력을 유지할 수 있습니다.

포털 및 관리 도구 중단에 대한 복원력

Azure 포털에서 Traffic Manager 프로필을 관리하는 경우, 특히 플랫폼 중단 중에 프로필을 다시 구성해야 하는 경우 액세스할 수 없는 시나리오를 준비합니다.

다른 Azure 서비스와 마찬가지로 Traffic Manager는 다양한 도구를 통해 배포 및 관리를 지원합니다. Azure CLI 또는 Azure PowerShell 사용하여 프로필을 관리하는 방법을 숙지하는 것이 좋습니다. 또는 인프라를 Bicep 또는 Terraform 같은 코드 기술로 사용하여 프로필을 배포하고 구성합니다. 이러한 도구는 Azure 포털의 성능이 저하된 경우에도 계속 작동합니다.

백업 및 복원

Traffic Manager는 상태 비저장 DNS 서비스입니다. 데이터를 유지하지 않으며 백업 또는 복원 기능이 없습니다.

리소스 구성을 보호하려면 인프라를 코드(예: Bicep 또는 ARM 템플릿)로 사용하여 Traffic Manager 프로필 및 기타 리소스를 정의하고 해당 정의를 소스 제어에 저장합니다. 리소스를 다시 만들어야 하는 경우 저장된 구성에서 다시 배포합니다.

서비스 유지 관리에 대한 복원력

Microsoft는 정기적으로 서비스 업데이트를 적용하고 다른 유지 관리를 수행합니다. Azure 플랫폼은 이러한 활동을 자동으로 처리하여 유지 관리가 원활하고 투명하도록 합니다. Azure Service Health 계획된 유지 관리를 통해 조언을 받지 않는 한 유지 관리 이벤트 중에 가동 중지 시간이 예상되지 않습니다.

서비스 수준 약정

Azure 서비스에 대한 SLA(서비스 수준 계약)는 각 서비스의 예상 가용성과 솔루션이 가용성 기대치를 달성하기 위해 충족해야 하는 조건을 설명합니다. 자세한 내용은 온라인 서비스 SLA를 참조하세요.

Azure Traffic Manager 클라이언트가 반복적으로 실패한 요청을 다시 시도하는 한 DNS 쿼리 응답에 대해 100개의% 가용성 SLA를 제공합니다.