Azure Data Lake Storage 계층 구조 네임스페이스를 사용하여 개체 스토리지 규모 및 가격에 파일 시스템 성능을 제공합니다. 이 기능은 계정 내의 개체 및 파일 컬렉션을 컴퓨터의 파일 시스템과 유사한 디렉터리 및 중첩된 하위 디렉터리의 계층 구조로 구성합니다. 계층 구조 네임스페이스를 사용하도록 설정하면 스토리지 계정은 분석 엔진 및 프레임워크가 익숙한 파일 시스템 의미 체계와 함께 개체 스토리지의 확장성 및 비용 효율성을 제공할 수 있습니다.
계층 구조 네임스페이스의 이점
Blob 데이터에 대해 계층 구조 네임스페이스를 구현하는 파일 시스템은 다음과 같은 이점을 제공합니다.
원자성 디렉터리 조작: 개체에서 경로 세그먼트를 나타내기 위해 개체 이름에 슬래시(/)를 포함하는 규칙을 채택하여 대략적인 디렉터리 계층 구조를 저장합니다. 이 규칙은 개체를 구성하는 데 사용되지만 디렉터리 이동, 이름 바꾸기 또는 삭제와 같은 작업에는 도움이 되지 않습니다. 실제 디렉터리가 없으면 애플리케이션은 디렉터리 수준 작업을 수행하기 위해 수백만 개의 개별 Blob을 처리해야 할 수 있습니다. 이와 대조적으로 계층 구조 네임스페이스는 단일 항목(부모 디렉터리)을 업데이트하여 관련 작업을 처리합니다.
이러한 최적화는 많은 빅 데이터 분석 프레임워크에서 특히 중요합니다. Hive 및 Spark와 같은 도구는 종종 임시 위치에 출력을 쓴 다음 작업이 끝날 때 위치 이름을 바꿉니다. 계층 구조 네임스페이스가 없으면 이 이름 바꾸기 작업은 분석 프로세스 자체보다 오래 걸릴 수 있습니다. 작업 대기 시간이 단축되면 분석 워크로드의 TCO(총 소유 비용)가 낮아집니다.
친숙한 인터페이스 스타일: 개발자와 사용자 모두 파일 시스템을 이해합니다. 클라우드로 이동하는 경우 Data Lake Storage 크고 작은 컴퓨터에서 사용하는 동일한 파일 시스템 인터페이스를 노출하므로 새 스토리지 패러다임을 배울 필요가 없습니다.
개체 저장소가 역사적으로 계층 구조 네임스페이스를 지원하지 않는 이유 중 하나는 계층 구조 네임스페이스 제한 크기 조정 때문입니다. 그러나 Data Lake Storage 계층 구조 네임스페이스는 선형적으로 확장되며 데이터 용량 또는 성능이 저하되지 않습니다.
계층 구조 네임스페이스를 사용할지 여부를 결정합니다.
계정에서 계층 구조 네임스페이스를 사용하도록 설정한 후에는 플랫 네임스페이스로 되돌릴 수 없습니다. 따라서 개체 저장소 워크로드의 특성에 따라 계층 구조 네임스페이스를 사용하도록 설정하는 것이 적절한지를 고려해야 합니다. 워크로드, 애플리케이션, 비용, 서비스 통합, 도구, 기능 및 설명서에 계층 구조 네임스페이스를 사용하도록 설정하면 미치는 영향을 평가하려면 Azure Data Lake Storage 기능을 사용하여 Azure Blob Storage 업그레이드를 참조 하세요.
일부 워크로드는 계층 구조 네임스페이스를 사용하도록 설정해도 유용하지 않을 수 있습니다. 예를 들어 백업, 이미지 스토리지 및 개체 조직이 개체 자체와 별도로 저장되는 기타 애플리케이션(예: 별도의 데이터베이스)이 있습니다.
또한 Blob Storage 기능 및 Azure 서비스 에코시스템에 대한 지원은 계속 증가하지만 일부 기능 및 Azure 서비스는 계층 구조 네임스페이스가 있는 계정에서 아직 지원되지 않습니다. 알려진 문제를 참조하세요.
계층 구조 네임스페이스의 이점을 활용하는 워크로드
일반적으로 디렉터리를 조작하는 파일 시스템을 위해 설계된 스토리지 워크로드의 계층 구조 네임스페이스를 설정합니다. 이 조건에는 모든 분석 처리 워크로드가 포함됩니다. 높은 수준의 조직이 필요한 데이터 세트는 계층 구조 네임스페이스를 사용하도록 설정하면 도움이 됩니다.
TCO 분석을 사용하여 계층 구조 네임스페이스를 사용하도록 설정할지 여부를 결정합니다. 일반적으로 스토리지 가속으로 인한 워크로드 대기 시간의 개선에는 컴퓨팅 리소스가 더 적은 시간 동안 필요합니다. 계층적 네임스페이스에서 가능한 원자적 디렉터리 조작으로 인해 많은 워크로드에서 대기 시간이 향상될 수 있습니다. 많은 워크로드에서 컴퓨팅 리소스는 총 비용의 85% 이상을 나타내므로 워크로드 대기 시간을 약간 줄이더라도 상당한 양의 TCO 절감액과 동일합니다. 계층 구조 네임스페이스를 사용하여 스토리지 비용이 증가하는 경우에도 감소된 컴퓨팅 비용으로 인해 TCO는 낮아집니다.
플랫 네임스페이스와 계층 구조 네임스페이스가 있는 계정 간의 데이터 스토리지 가격, 트랜잭션 가격 및 스토리지 용량 예약 가격 책정의 차이를 분석하려면 Azure Data Lake Storage 가격을 참조하세요.
계층 구조 네임스페이스를 사용하도록 설정하려면 Azure Data Lake Storage 사용할 스토리지 계정 만들기(새 계정) 또는 Azure Data Lake Storage 기능(기존 계정)을 사용하여 Azure Blob Storage 업그레이드를 참조하세요.
다음 단계
- 새 스토리지 계정을 만들 때 계층 구조 네임스페이스를 사용하도록 설정합니다. Azure Data Lake Storage에서 사용할 스토리지 계정 만들기를 참조하세요.
- 기존 스토리지 계정에서 계층 구조 네임스페이스를 사용하도록 설정합니다. Azure Data Lake Storage 기능을 사용하여 Azure Blob Storage 업그레이드를 참조 하세요.