Azure Elastic SAN 다양한 컴퓨팅 옵션에 대해 확장 가능하고 비용 효율적이고 고성능이며 포괄적인 스토리지 솔루션을 제공하는 SAN(클라우드 네이티브 스토리지 영역 네트워크) 서비스입니다. Elastic SAN을 사용하면 iSCSI 프로토콜을 통해 가상 머신, 컨테이너 또는 기타 Azure 서비스에 연결할 수 있는 가상 디스크인 볼륨을 만들고 관리할 수 있습니다.
Azure를 사용하는 경우 안정성은 공유 책임입니다. Microsoft는 복원력 및 복구를 지원하는 다양한 기능을 제공합니다. 이러한 기능이 사용하는 모든 서비스 내에서 작동하는 방식을 이해하고 비즈니스 목표 및 가동 시간 목표를 충족하는 데 필요한 기능을 선택할 책임이 있습니다.
이 문서에서는 일시적인 오류, 가용성 영역 오류 및 지역 전체 오류를 포함하여 다양한 잠재적 중단 및 문제에 Azure Elastic SAN 복원력을 제공하는 방법을 설명합니다. 또한 백업 및 복구 옵션에 대해 설명하고 Azure Elastic SAN SLA(서비스 수준 계약)에 대한 주요 정보를 강조 표시합니다.
안정성을 위한 프로덕션 배포 권장 사항
프로덕션 워크로드의 경우 다음을 수행하는 것이 좋습니다.
- ZRS(영역 중복 스토리지) 사용: ZRS는 세 가지 가용성 영역에 데이터 복사본을 분산합니다.
- 영역 오류 시 수동 개입을 줄이기 위해 네트워크 액세스를 구성합니다. 프라이빗 엔드포인트를 사용하면 수동 개입 없이 자동 영역 장애 조치(failover)를 수행할 수 있지만 서비스 엔드포인트에는 수동 개입이 필요할 수 있습니다.
- 지역 간 재해 복구가 필요한 워크로드의 경우: 볼륨의 스냅샷을 정기적으로 만들고 데이터 보호를 위해 관리 디스크 스냅샷으로 내보냅니다. 주 지역에서 지리적으로 먼 보조 지역에 스냅샷을 복사합니다.
안정성 아키텍처 개요
Elastic SAN에는 다음과 같은 세 가지 수준의 리소스 계층이 있습니다.
- 탄력적 SAN: 중복성을 구성하고, 스토리지 용량을 할당하고, 성능 제한을 설정하는 최상위 리소스입니다. Elastic SAN에 할당된 기본 단위 수는 전체 SAN에서 사용할 수 있는 총 IOPS 및 처리량을 결정합니다.
- 볼륨 그룹: 대규모 볼륨을 관리하는 데 사용되는 관리 구문입니다. 프라이빗 엔드포인트 또는 서비스 엔드포인트와 같은 네트워크 액세스 설정은 볼륨 그룹 수준에서 구성되고 그룹의 모든 볼륨에서 상속됩니다.
- 볼륨: SAN의 총 용량에서 분할된 개별 스토리지 볼륨입니다. 볼륨은 iSCSI 프로토콜을 통해 컴퓨팅 리소스에 연결됩니다.
배포하는 리소스에 대한 자세한 내용은 Elastic SAN 리소스를 참조하세요.
내부적으로 Elastic SAN은 스토리지 클러스터 내에 데이터를 저장합니다. LRS(로컬 중복 스토리지)를 사용하도록 Elastic SAN을 구성하는 경우 데이터는 한 데이터 센터의 단일 스토리지 클러스터 내에서 세 번 복제됩니다. 3개의 가용성 영역에 데이터 복사본을 저장하도록 ZRS(영역 중복 스토리지)를 구성할 수 있습니다. 자세한 내용은 가용성 영역 오류에 대한 복원력을 참조하세요.
일시적인 오류에 대한 복원력
일시적인 오류는 구성 요소에서 짧고 간헐적인 오류입니다. 클라우드와 같은 분산 환경에서 자주 발생하며 작업의 일반적인 부분입니다. 일시적인 오류는 짧은 시간 후에 스스로 수정됩니다. 애플리케이션은 일반적으로 영향을 받는 요청을 다시 시도하여 일시적인 오류를 처리할 수 있는 것이 중요합니다.
모든 클라우드 호스팅 애플리케이션은 클라우드 호스팅 API, 데이터베이스 및 기타 구성 요소와 통신할 때 Azure 임시 오류 처리 지침을 따라야 합니다. 자세한 내용은 임시 오류 처리를 위한 권장 사항을 참조하세요.
Elastic SAN 볼륨에 대한 iSCSI 연결이 중단되면 클라이언트의 iSCSI 초기자가 자동으로 다시 연결을 시도합니다. 다시 연결하는 동안 I/O 작업에서 잠시 일시 중지가 발생할 수 있습니다. 일시적인 중단을 처리하도록 적절한 재시도 및 시간 제한 설정으로 iSCSI 초기자를 구성합니다. 자세한 iSCSI 및 MPIO 설정 권장 사항은 Elastic SAN의 성능 최적화를 참조하세요.
가용성 영역 오류에 대한 복원력
가용성 영역은 Azure 지역 내에서 물리적으로 별도의 데이터 센터 그룹입니다. 한 영역이 실패하면 서비스가 나머지 영역 중 하나로 전환될 수 있습니다.
Azure Elastic SAN ZRS(영역 중복 스토리지)를 사용하도록 구성할 수 있습니다. 즉, 데이터가 지역의 세 가용성 영역에서 동기적으로 복제됩니다. 영역 중복성은 프로덕션 워크로드에 대한 복원력과 안정성을 달성하는 데 도움이 됩니다.
연결 방식은 영역 오류 발생 시 워크로드가 투명하게 장애 조치를 수행할 수 있는 능력에 영향을 줍니다. 프라이빗 엔드포인트를 사용하여 볼륨에 연결하는 것이 좋습니다. 프라이빗 엔드포인트는 자동 장애 조치(failover)를 지원합니다. 서비스 엔드포인트를 사용하는 경우 장애 조치에 수동 개입이 필요할 수 있습니다. 연결 방법에 대한 자세한 내용은 Elastic SAN의 네트워킹 구성에 대한 자세한 내용을 참조하세요.
LRS(로컬 중복 스토리지)를 사용하면 Elastic SAN이 가용성 영역 오류에 대해 보호되지 않습니다. LRS는 ZRS를 사용하여 영역에 분산하지 않고 단일 가용성 영역에 데이터를 저장하여 Elastic SAN을 비 영역 으로 만듭니다.
요구 사항
지역 지원: 영역 중복 Elastic SAN 리소스는 하위 지역 집합에 배포할 수 있습니다. 지역 목록은 Elastic SAN에 대한 크기 조정 대상을 참조하세요.
Cost
ZRS를 사용하여 Elastic SAN을 만들면 비용이 LRS보다 높습니다. 가격 책정에 대한 자세한 내용은 Azure Elastic SAN 가격 책정 참조하세요.
가용성 영역 지원 구성
ZRS를 사용하여 새 Elastic SAN을 만듭니 다. Elastic SAN을 만들고 ZRS를 중복 옵션으로 선택하면 Elastic SAN이 자동으로 영역 중복됩니다. Elastic SAN을 만든 후에는 중복 옵션을 변경할 수 없습니다. 새 Elastic SAN 리소스를 만드는 방법에 대한 자세한 내용은 Elastic SAN 배포를 참조하세요.
기존 LRS Elastic SAN에서 영역 중복을 사용하도록 설정합니다 . LRS Elastic SAN을 ZRS로 변환할 수 없습니다. 마이그레이션하려면 Elastic SAN 볼륨을 스냅샷으로 만들고, 관리 디스크 스냅샷으로 내보내고, ZRS에 새 Elastic SAN을 배포한 다음, 해당 디스크 스냅샷을 사용하여 새 Elastic SAN에 볼륨을 만듭니다. 자세한 내용은 Snapshot Azure Elastic SAN 볼륨 참조하세요.
모든 영역이 정상인 경우의 동작
이 섹션에서는 영역 중복성을 위해 Elastic SAN을 구성하고 모든 영역이 작동할 때 예상되는 사항에 대해 설명합니다.
영역 간 작업: Elastic SAN 볼륨에 연결하면 iSCSI 연결이 가용성 영역 중 하나의 클러스터로 라우팅됩니다. 플랫폼은 영역 간에 트래픽을 자동으로 라우팅합니다.
영역 간 데이터 복제: 클라이언트가 Elastic SAN 볼륨에 데이터를 쓸 때 해당 데이터는 쓰기 작업이 승인되기 전에 세 개의 가용성 영역 내의 클러스터에 동기적으로 기록됩니다. 동기 복제는 높은 수준의 데이터 일관성을 보장하고 영역 오류 중에 데이터가 손실되지 않도록 합니다.
ZRS Elastic SAN을 배포하면 LRS Elastic SAN보다 안정성이 향상되지만 쓰기 대기 시간이 더 많이 추가됩니다. Elastic SAN을 벤치마킹하고 애플리케이션의 워크로드를 시뮬레이션하여 LRS와 ZRS 간의 대기 시간을 비교하여 워크로드에 영향을 주는지 확인합니다.
영역 오류 중 동작
이 섹션에서는 영역 중복성을 위해 Elastic SAN을 구성할 때 예상되는 작업에 대해 설명하며 영역 중 하나에 중단이 발생합니다.
검색 및 응답: Elastic SAN 플랫폼은 가용성 영역에서 오류를 검색합니다. ZRS Elastic SAN에 대한 영역 장애 조치(failover)를 시작하기 위해 아무 작업도 수행할 필요가 없습니다.
통지: 영역이 다운된 경우 Microsoft는 자동으로 알리지 않습니다. 그러나 Azure Service Health 를 사용하여 영역 오류를 포함하여 서비스의 전반적인 상태를 파악할 수 있으며, 문제를 알리도록 Service Health 경고를 설정할 수 있습니다.
활성 요청: 가용성 영역을 사용할 수 없게 되면 서비스는 영향을 받는 영역의 복제본에 연결하는 진행 중인 I/O 작업을 종료할 수 있으며 해당 작업을 다시 시도해야 합니다. 프라이빗 엔드포인트를 사용하는 경우 서비스가 장애 발생 시 자동으로 전환됩니다. 서비스 엔드포인트를 사용하는 경우 건강한 영역으로 전환(failover)하려면 iSCSI 이니시에이터를 다시 시작해야 할 수 있습니다.
예상 데이터 손실: Elastic SAN은 세 개의 가용성 영역에서 데이터를 동기적으로 복제하여 영역 실패 시 데이터 손실을 방지합니다.
예상 가동 중지 시간: 프라이빗 엔드포인트를 사용하는 경우 영역 장애 조치(failover)가 자동으로 수행됩니다. SAN이 자체 균형을 조정하는 동안 장애 조치(failover) 후 몇 분 동안 가용성 및 성능 저하가 발생할 수 있습니다.
서비스 엔드포인트를 사용하는 경우 Elastic SAN은 자동으로 정상 영역으로 전환되지 않습니다. 다른 정상 영역으로 장애 조치(failover)를 시작하려면 iSCSI 초기자를 다시 시작해야 할 수 있습니다.
트래픽 경로 변경: 영역을 사용할 수 없는 경우 Elastic SAN 플랫폼은 영역의 손실을 감지하고 나머지 정상 영역으로 트래픽을 라우팅합니다.
수동 개입 없이 자동 영역 장애 조치(failover)를 보장하려면 프라이빗 엔드포인트를 사용하여 Elastic SAN에 연결합니다. 프라이빗 엔드포인트 대신 서비스 엔드포인트를 사용하는 경우 iSCSI 초기자를 수동으로 다시 시작하여 정상 영역으로 장애 조치(failover)를 시작해야 할 수 있습니다.
영역 복구
가용성 영역이 복구되면 Elastic SAN 플랫폼은 자동으로 정상 작업을 복원하고 세 영역에서 복제를 다시 시작합니다. 아무 작업도 수행할 필요가 없습니다.
영역 오류 테스트
Azure Elastic SAN 플랫폼은 영역 중복 리소스에 대한 트래픽 라우팅, 장애 조치 및 영역 복구를 관리합니다. 이 기능은 완전히 관리되므로 가용성 영역 오류 프로세스의 유효성을 검사할 필요가 없습니다.
지역 전체 오류에 대한 복원력
Azure Elastic SAN 단일 지역 서비스입니다. 지역을 사용할 수 없게 되면 Elastic SAN 리소스도 사용할 수 없습니다. Elastic SAN에는 자동 지역 간 복제 기능이나 장애 발생시 전환 기능이 내장되어 있지 않습니다. 워크로드에 지역 수준 복원력이 필요한 경우 자체 다중 지역 재해 복구 솔루션을 설계할 책임이 있습니다.
복원력을 위한 사용자 지정 다중 지역 솔루션
Elastic SAN 데이터에 대한 다중 지역 재해 복구를 구현할 책임이 있습니다. 권장되는 방법은 볼륨 스냅샷을 사용하는 것입니다.
정기적으로 스냅샷을 만듭니다. 볼륨 스냅샷을 사용하여 Elastic SAN 볼륨의 지정 시간 복사본을 캡처합니다.
RPO(복구 지점 목표)는 스냅샷을 만들고 보조 지역에 복사하는 빈도에 따라 달라집니다. 스냅샷을 만들고 복사하는 빈도는 높아질수록 재해 발생 시 데이터 손실 가능성이 낮아질 수 있습니다.
스냅샷을 관리 디스크 스냅샷으로 내보냅니다.볼륨 스냅샷을 다른 지역에 복사할 수 있는 관리 디스크 스냅샷으로 내보냅니다.
보조 지역에 스냅샷을 복사합니다.주 지역에서 지리적으로 멀리 떨어진 새 지역에 증분 스냅샷을 복사합니다. 이렇게 하면 여러 지역이 단일 재해의 영향을 받을 위험이 줄어듭니다.
스냅샷에서 복원합니다. 재해 복구 시나리오에서 복사된 관리 디스크 스냅샷에서 보조 Elastic SAN에 새 볼륨을 만듭니다.
RTO(복구 시간 목표)는 데이터의 크기, 지역 간에 스냅샷을 복사하는 데 걸리는 시간 및 보조 지역에서 새 Elastic SAN을 배포하고 구성하는 데 필요한 시간에 따라 달라집니다. 복구 시간을 줄이려면 재해가 발생하기 전에 복구 지역에 보조 Elastic SAN을 배포하는 것이 좋습니다. 또한 중단 시 용량 제약 조건을 방지할 수 있습니다.
백업 및 복원
대부분의 솔루션의 경우 백업에만 의존해서는 안 됩니다. 대신 이 가이드에 설명된 다른 기능을 사용하여 복원력 요구 사항을 지원합니다. 그러나 백업은 다른 방법이 사용하지 않는 일부 위험으로부터 보호합니다. 자세한 내용은 중복도, 복제 및 백업이란?을 참조하세요.
Elastic SAN은 다음 두 가지 유형의 백업을 지원합니다.
Azure Elastic SAN backup: 이 Azure Backup 기능은 백업을 예약하고 복구 지점의 만료 일정을 설정하고 복구 데이터를 새 볼륨으로 설정하는 완전히 관리되는 솔루션을 제공합니다. 실수로 인한 삭제, 랜섬웨어 및 애플리케이션 업데이트로 인한 데이터 손실로부터 보호할 수 있습니다. 자세한 내용은 Azure Elastic SAN 백업(미리 보기) 참조하세요.
Important
이 솔루션은 Microsoft의 Azure Preview 추가 약관에 포함되므로 프로덕션용이 아닌 테스트에 사용합니다.
스냅샷: 또는 데이터 보호 요구 사항에 따라 스냅샷을 만들고 관리할 수 있습니다.
Azure Elastic SAN 데이터 보호를 위해 볼륨 스냅샷을 지원합니다. 스냅샷은 특정 시점에서의 증분 복제본으로, Elastic SAN의 총 용량에서 공간을 차지합니다. 데이터를 보호하려면 정기적으로 스냅샷을 만듭니다. 빈도는 손실할 수 있는 데이터 양(RPO)에 따라 달라집니다. 스냅샷을 수동으로 만들거나 고유한 자동화를 빌드하여 일정에 따라 만들 수 있습니다.
스냅샷은 볼륨과 동일한 Elastic SAN 내에 저장되며 동일한 중복 설정을 사용합니다. 지역 전체의 오류로부터 보호하려면 스냅샷을 관리 디스크 스냅샷으로 내보내고 다른 지역에 복사합니다. 자세한 내용은 볼륨 스냅샷 내보내기 및 새 지역에 증분 스냅샷 복사를 참조하세요.
스냅샷 또는 관리 디스크 스냅샷에서 새 Elastic SAN 볼륨을 만들 수 있습니다. 자세한 내용은 스냅샷에서 볼륨 만들기를 참조하세요.
서비스 유지 관리에 대한 복원력
Microsoft는 정기적으로 서비스 업데이트를 적용하고 다른 유지 관리를 수행합니다. Azure 플랫폼은 이러한 활동을 자동으로 처리하여 유지 관리가 원활하고 투명하도록 합니다. Azure Service Health 계획된 유지 관리를 통해 조언을 받지 않는 한 유지 관리 이벤트 중에 가동 중지 시간이 예상되지 않습니다.
서비스 수준 약정
Azure 서비스에 대한 SLA(서비스 수준 계약)는 각 서비스의 예상 가용성과 솔루션이 가용성 기대치를 달성하기 위해 충족해야 하는 조건을 설명합니다. 자세한 내용은 온라인 서비스 SLA를 참조하세요.