다음 Databricks SQL 기능 및 향상된 기능은 2026년에 릴리스되었습니다.
2026년 3월
Databricks SQL 버전 2026.10은 이제 미리 보기에서 사용할 수 있습니다.
2026년 3월 26일
이제 미리 보기 채널에서 Databricks SQL 버전 2026.10을 사용할 수 있습니다. 다음 섹션을 검토하여 새로운 기능, 동작 변경 및 버그 수정에 대해 알아봅니다.
관찰 메트릭 오류는 더 이상 쿼리에 실패하지 않습니다.
관찰 메트릭 수집 중 오류가 더 이상 쿼리 실행 실패를 일으키지 않습니다. 이전에는 절의 OBSERVE 오류(예: 0으로 나누기)가 전체 쿼리를 차단하거나 실패할 수 있습니다. 이제 쿼리가 성공적으로 완료되고 호출 observation.get할 때 오류가 발생합니다.
MEASURE 집계 함수에 대한 FILTER 절
이제 MEASURE 집계 함수는 FILTER 절을 지원합니다. 이전에는 필터가 자동으로 무시되었습니다.
Unity 카탈로그 CRTAS 작업을 위한 최적화된 쓰기 작업
만들기 또는 바꾸기 TABLE 분할된 Unity 카탈로그 테이블에 대한 AS SELECT (CRTAS) 작업은 기본적으로 최적화된 쓰기를 적용하여 더 적은 수의 더 큰 파일을 생성합니다.
spark.databricks.delta.optimizeWrite.UCTableCRTAS.enabled을 false로 설정하여 비활성화합니다.
타임스탬프 파티션 값은 세션 표준 시간대를 사용합니다.
타임스탬프 파티션 값은 이제 SQL 웨어하우스 세션 표준 시간대를 사용합니다. Databricks SQL 버전 2025.40 이전에 작성된 타임스탬프 파티션이 있는 경우 새 데이터를 쓰기 전에 파티션 메타데이터를 확인하려면 실행 SHOW PARTITIONS 합니다.
DESCRIBE FLOW 예약 키워드
이제 명령을 DESCRIBE FLOW 사용할 수 있습니다. 이름이 flow인 테이블이 있는 경우, DESCRIBE schema.flow`, `DESCRIBE TABLE flow`, `DESCRIBE `flow` ` 백틱과 함께 사용하십시오.
SpatialSQL 부울 집합 연산
ST_Difference, ST_Intersection, 및 ST_Union는 다음과 같은 개선 사항을 가진 새로운 구현을 사용합니다.
- 유효한 입력 기하 도형은 항상 결과를 생성하고 더 이상 오류를 발생하지 않습니다. 잘못된 입력은 오류를 발생시키지 않지만 유효한 결과를 생성하지 못할 수 있습니다.
- 약 2배 더 빠른 성능.
- 결과는 수식과 연산 순서가 다르기 때문에 선 세그먼트 교집합의 15번째 소수점 이후 달라질 수 있습니다.
- 결과는 일관되고 유사한 출력에 대해 정규화됩니다.
- 점이 좌표 값을 기준으로 정렬됩니다.
- 라인스트링은 가능한 가장 긴 경로에서 구성됩니다.
- 다각형 링은 회전되므로 첫 번째 점에 가장 작은 좌표 값이 있습니다.
- 이 정규화는 두 개의 겹치지 않는 기하 도형으로 호출
ST_Difference하는 경우를 제외하고 모든 경우에 적용됩니다. 여기서 첫 번째 기하 도형은 수정되지 않은 상태로 반환됩니다.
SQLSTATE에 대한 예외 형식
이제 예외 유형 이 SQLSTATE를 지원합니다. 코드가 문자열 일치로 예외를 구문 분석하거나 특정 예외 유형을 처리하는 경우 오류 처리 논리를 업데이트합니다.
Microsoft Azure Synapse에 대한 DATETIMEOFFSET 데이터 형식 지원
이제 데이터 형식을 DATETIMEOFFSET Microsoft Azure Synapse 연결에 사용할 수 있습니다.
Google BigQuery 테이블 주석
Google BigQuery 테이블 설명은 테이블 주석으로 해결되어 노출됩니다.
INSERT 구문을 사용한 스키마 진화
SQL WITH SCHEMA EVOLUTION 문과 함께 INSERT 절을 사용하여 삽입 작업 중에 대상 테이블의 스키마를 자동으로 업데이트합니다.
INSERT INTO, INSERT OVERWRITE, 및 INSERT INTO ... REPLACE 형식에 대해 절이 지원됩니다. 다음은 그 예입니다.
INSERT WITH SCHEMA EVOLUTION INTO students TABLE visiting_students_with_additional_id;
대상 Delta Lake 테이블의 스키마는 원본에서 추가 열 또는 확장된 형식을 수용하도록 업데이트됩니다. 자세한 내용은 스키마 진화 및 INSERT 문 구문을 참조하세요.
INSERT 작업에서 NULL 구조체 값을 보존함
INSERT 이제 스키마 진화 또는 암시적 캐스팅을 사용하는 작업은 원본 테이블과 대상 테이블의 구조체 필드 순서가 다를 때 구조체 값을 유지 NULL 합니다.
parse_timestamp SQL 함수
parse_timestamp SQL 함수는 여러 패턴을 사용하여 타임스탬프 문자열을 구문 분석하고 여러 형식으로 타임스탬프를 구문 분석할 때 성능을 향상시키기 위해 Photon 엔진에서 실행됩니다. 날짜/시간 패턴 서식에 대한 자세한 내용은 Datetime 패턴을 참조하세요.
max_by 및 min_by (선택 제한 포함)
이제 집계 함수 가 max_bymin_by 선택적 세 번째 인수 limit (최대 100,000개)를 허용합니다. 제공된 경우 함수는 순서 지정 식의 가장 큰 값(또는 가장 작은) 값에 해당하는 최대 limit 값의 배열을 반환하여 창 함수 또는 CTE 없이 상위 K 및 하위 K 쿼리를 간소화합니다.
벡터 집계 및 스칼라 함수
새 SQL 함수는 임베딩 및 유사성 워크로드를 위해 ARRAY<FLOAT> 벡터에서 작동합니다.
집계 함수:
- vector_avg: 그룹의 요소별 벡터 평균을 반환합니다.
- vector_sum: 그룹의 요소별 벡터 합계를 반환합니다.
스칼라 함수:
- vector_cosine_similarity: 두 벡터의 코사인 유사성을 반환합니다.
- vector_inner_product: 두 벡터의 내부(점) 곱을 반환합니다.
- vector_l2_distance: 두 벡터 사이의 유클리드(L2) 거리를 반환합니다.
- vector_norm: 벡터의 Lp 표준(1, 2 또는 무한대)을 반환합니다.
- vector_normalize: 단위 길이로 정규화된 벡터를 반환합니다.
복합 명령문의 SQL 커서 지원
SQL 스크립팅 복합 문은 이제 커서 처리를 지원합니다.
DECLARE CURSOR를 사용하여 커서를 정의한 다음 OPEN 문, FETCH 문 및 CLOSE 문을 정의하여 쿼리를 실행하고 행을 한 번에 하나씩 사용합니다. 커서는 행 단위 처리와 같은 NOT FOUND 매개 변수 표식 및 조건 처리기를 사용할 수 있습니다.
대략적인 상위 k 스케치 함수
새로운 함수를 사용하면 분산된 Top-K 집계를 위해 대략적인 상위 K 스케치를 빌드하고 결합할 수 있습니다.
- approx_top_k_accumulate: 그룹당 스케치를 작성합니다.
- approx_top_k_combine: 스케치를 병합합니다.
- approx_top_k_estimate: 예상 개수가 있는 상위 K 항목을 반환합니다.
자세한 내용은 집계 함수 및 approx_top_k 참조 하세요.
튜플 스케치 함수
튜플 스케치에 대한 새 집계 및 스칼라 함수는 키 요약 쌍에 대한 고유 계산 및 집계를 지원합니다.
집계 함수:
-
tuple_sketch_agg_double집계 함수 -
tuple_sketch_agg_integer집계 함수 -
tuple_union_agg_double집계 함수 -
tuple_union_agg_integer집계 함수 -
tuple_intersection_agg_double집계 함수 -
tuple_intersection_agg_integer집계 함수
스칼라 함수:
- tuple_sketch_estimate
- tuple_sketch_summary
- tuple_sketch_theta
- tuple_union
- tuple_intersection
- tuple_difference
Unity 카탈로그 Python UDF에 대한 사용자 지정 종속성
Unity Catalog Python UDF(사용자 정의 테이블 함수)는 이제 외부 라이브러리에 대한 사용자 지정 종속성을 사용할 수 있으므로 기본 SQL 웨어하우스 환경에서 사용할 수 있는 것 이상의 패키지를 사용할 수 있습니다. 사용자 지정 종속성 사용하여 UDF 확장참조하세요.
새 지리 공간적 함수
이제 다음 지리 공간적 함수를 사용할 수 있습니다.
-
st_estimatesrid함수: 입력 기하 도형에 대해 가장 잘 프로젝션된 SRID(공간 참조 식별자)를 예측합니다. -
st_force2d함수: 지리 또는 기하 도형을 2D 표현으로 변환합니다. -
st_nrings함수: 외곽 및 내부 링을 포함하여 폴리곤 또는 멀티폴리곤의 총 링 수를 계산합니다. -
st_numpoints함수: 지리 또는 기하 도형에서 비어있지 않은 점의 수를 계산합니다.
지리 공간적 함수에 대한 광자 지원
이제 더 빠른 성능을 위해 Photon 엔진에서 다음 지리 공간적 함수가 실행됩니다.
2026년 2월
Databricks SQL 버전 2025.40이 현재 버전에서 롤아웃됩니다.
2026년 2월 23일
Databricks SQL 버전 2025.40이 현재 채널로 롤아웃됩니다. 2025.40의 기능을 참조하세요.
Databricks SQL 버전 2025.40은 이제 미리 보기에서 사용할 수 있습니다.
2026년 2월 11일
이제 미리 보기 채널에서 Databricks SQL 버전 2025.40을 사용할 수 있습니다. 다음 섹션을 검토하여 새로운 기능, 동작 변경 및 버그 수정에 대해 알아봅니다.
SQL 스크립팅은 일반적으로 사용할 수 있습니다.
이제 SQL 스크립팅이 일반 공급됩니다. 조건문, 루프, 지역 변수 및 예외 처리를 포함하여 SQL을 사용하여 절차 논리를 작성합니다.
이제 더 많은 SQL 컨텍스트에서 지원되는 매개 변수 표식
이제 적절한 형식의 리터럴 값이 허용되는 모든 곳에서 명명된(:param) 및 명명되지 않은(?) 매개 변수 표식을 사용할 수 있습니다. 여기에는 CREATE VIEW v AS SELECT ? AS c1와 같은 DDL 문, DECIMAL(:p, :s)와 같은 열 형식, COMMENT ON t IS :comment와 같은 주석이 포함됩니다. 이렇게 하면 코드를 SQL 삽입 공격에 노출하지 않고도 다양한 SQL 문을 매개 변수화할 수 있습니다.
매개 변수 표식을 참조하세요.
IDENTIFIER 절이 더 많은 SQL 컨텍스트로 확장됨
IDENTIFIER 문자열을 SQL 개체 이름으로 캐스팅하는 절은 이제 식별자가 허용되는 거의 모든 컨텍스트에서 지원됩니다. 확장된 매개 변수 표식 및 리터럴 문자열 병합 지원과 결합하면 열 별칭()에서 열 정의(AS IDENTIFIER(:name)IDENTIFIER(:pk) BIGINT NOT NULL)에 이르기까지 모든 항목을 매개 변수화할 수 있습니다.
IDENTIFIER 조항참조하세요.
리터럴 문자열 병합은 모든 곳에서 지원됩니다
순차 문자열 리터럴인 'Hello' ' World'은 문자열 리터럴이 허용되는 모든 상황에서 'Hello World'으로 병합됩니다, 예를 들면 COMMENT 'This' ' is a ' 'comment'와 같은 경우입니다.
STRING 형식참조하세요.
새 BITMAP_AND_AGG 함수
이제 새로운 BITMAP_AND_AGG 함수를 사용하여 기존 함수 라이브러리 BITMAP 를 보완할 수 있습니다.
고유 개수를 대략적으로 계산하기 위한 새 세타 스케치 함수
이제 Datasketches Theta Sketch를 사용하여 대략적인 고유 개수 및 설정 작업에 대한 함수의 새 라이브러리를 사용할 수 있습니다.
-
theta_sketch_agg집계 함수 -
theta_union_agg집계 함수 -
theta_intersection_agg집계 함수 -
theta_sketch_estimate함수 -
theta_union함수 -
theta_difference함수 -
theta_intersection함수
근사 분위수에 대한 새 KLL Sketch 함수
이제 대략적인 분위수 계산을 위한 KLL 스케치를 빌드하기 위한 새로운 함수 라이브러리를 사용할 수 있습니다.
-
kll_sketch_agg_bigint집계 함수 -
kll_sketch_get_quantile_bigint함수 -
kll_sketch_merge_bigint함수 -
kll_sketch_agg_double집계 함수 -
kll_sketch_get_quantile_double함수 -
kll_sketch_merge_double함수 -
kll_sketch_agg_float집계 함수 -
kll_sketch_get_quantile_float함수 -
kll_sketch_merge_float함수 -
kll_sketch_get_n_bigint함수 -
kll_sketch_get_rank_bigint함수 -
kll_sketch_to_string_bigint함수 -
kll_sketch_get_n_double함수 -
kll_sketch_get_rank_double함수 -
kll_sketch_to_string_double함수 -
kll_sketch_get_n_float함수 -
kll_sketch_get_rank_float함수 -
kll_sketch_to_string_float함수
여러 KLL 스케치를 집계 컨텍스트에서 병합하려면 kll_merge_agg_bigint, kll_merge_agg_double, 그리고 kll_merge_agg_float을 사용할 수 있습니다.
메트릭 뷰의 SQL 창 함수
이제 메트릭 뷰에서 SQL 창 함수를 사용하여 실행 중인 합계, 순위 및 기타 창 기반 계산을 계산할 수 있습니다.
새 지리 공간적 함수
이제 다음과 같은 새로운 지리 공간적 함수를 사용할 수 있습니다.
-
st_azimuthfunction: 첫 번째 지점에서 두 번째 지점까지의 북쪽 기반 azimuth를 라디안 단위[0, 2π)로 반환합니다. -
st_boundary함수: 입력 기하 도형의 경계를 반환합니다. -
st_closestpoint함수: 두 번째 기하 도형에 가장 가까운 첫 번째 기하 도형에 있는 점의 2D 프로젝션을 반환합니다. -
st_geogfromewkt함수: 지리에 대한 확장된 잘 알려진 텍스트 (EWKT) 설명을 파싱합니다. -
st_geomfromewkt함수: 기하 데이터의 EWKT(확장 Well-Known 텍스트) 설명을 구문 분석합니다.
기존 기하 도형 및 지리 함수에 대한 EWKT 입력 지원
이제 다음 함수는 EWKT(Extended Well-Known Text)를 입력으로 허용합니다.
행 필터 및 열 마스크가 있는 테이블에 대해 반복되는 쿼리에 대한 성능 향상
행 필터 및 열 마스크가 있는 테이블에 대해 반복된 적격 쿼리는 이제 쿼리 결과 캐싱이 향상되어 실행 시간이 더 빨라집니다.
지리 공간적 함수 성능 향상
셔플 공간 조인 기능 지원으로 공간 조인의 성능이 향상되었습니다. 이제 다음 ST 함수에는 Photon 구현이 있습니다.
FSCK REPAIR TABLE 는 기본적으로 메타데이터 복구를 포함합니다.
FSCK REPAIR TABLE 이제 누락된 데이터 파일을 확인하기 전에 초기 메타데이터 복구 단계를 포함하므로 손상된 검사점 또는 잘못된 파티션 값이 있는 테이블에서 작업할 수 있습니다. 또한 출력 스키마의 dataFilePathFSCK REPAIR TABLE DRY RUN 열은 이제 null을 허용하여 데이터 파일 경로를 적용할 수 없는 새 문제 유형을 지원합니다.
DESCRIBE TABLE 출력에는 메타데이터 열이 포함됩니다.
이제 출력 DESCRIBE TABLE [EXTENDED] 에는 모든 테이블 형식에 대한 열이 metadata 포함됩니다. 이 열에는 테이블에 JSON 문자열로 정의된 의미 체계 메타데이터(표시 이름, 형식 및 동의어)가 포함됩니다.
MERGE 및 UPDATE 스트리밍 쓰기 작업에서 유지되는 NULL 구조체
이제 Delta LakeMERGE, UPDATE, 및 구조체 형식 캐스트를 포함하는 스트리밍 쓰기 작업에서 NULL 구조체가 NULL로 유지됩니다. 이전에는 NULL 구조체가 모든 필드가 NULL로 설정된 구조체로 확장되었습니다.
Parquet 파일에서 물리화된 파티션 열
분할된 Delta Lake 테이블은 이제 새로 작성된 Parquet 데이터 파일에서 파티션 열을 구체화합니다. 이전에는 파티션 값이 Delta Lake 트랜잭션 로그 메타데이터에만 저장되었습니다. Delta Lake에서 작성한 Parquet 파일을 직접 읽는 워크로드에는 새로 작성된 파일에 추가 파티션 열이 표시됩니다.
타임스탬프 파티션 값은 세션 표준 시간대를 존중합니다.
이제 spark.sql.session.timeZone 구성을 사용하여 타임스탬프 파티션 값이 올바르게 조정됩니다. 이전에는 JVM 표준 시간대를 사용하여 UTC로 잘못 변환되었습니다.
시간 여행 제한 업데이트됨
이제 Azure Databricks는 모든 테이블에 대한 임계값을 초과하는 시간 이동 쿼리를 deletedFileRetentionDuration 차단합니다. 이 VACUUM 명령은 값이 0시간인 경우를 제외하고 보존 기간 인수를 무시합니다.
deletedFileRetentionDuration를 logRetentionDuration보다 크게 설정할 수 없습니다.
SHOW TABLES DROPPED는 LIMIT 절을 준수합니다
SHOW TABLES DROPPED 이제 LIMIT 절을 올바르게 준수합니다.