유니폼

지정된 숫자 범위에서 독립적 동일 분포(i.i.d.)로부터 추출한 임의 값을 반환합니다. 임의 시드는 선택 사항입니다. 범위의 최소값과 최대값을 지정하는 제공된 숫자는 상수여야 합니다. 이 두 숫자가 모두 정수이면 결과는 정수이기도 합니다. 그렇지 않으면 둘 중 하나 또는 둘 다 부동 소수점 숫자인 경우 결과는 부동 소수점 숫자이기도 합니다. Spark Connect를 지원합니다.

Databricks Runtime 16.1에 추가됨

해당 Databricks SQL 함수에 대해 알아보려면 uniform 함수를 참조하세요.

문법

from pyspark.sql import functions as dbf

dbf.uniform(min=<min>, max=<max>, seed=<seed>)

매개 변수

매개 변수 유형 Description
min pyspark.sql.Column, int, or float 범위의 최소값입니다.
max pyspark.sql.Column, int, or float 범위의 최대값입니다.
seed pyspark.sql.Column or int 사용할 선택적 난수 시드입니다.

Returns

pyspark.sql.Column: 지정된 범위 내에서 생성된 난수입니다.

예시

from pyspark.sql import functions as dbf
spark.range(0, 10, 1, 1).select(dbf.uniform(5, 105, 3)).show()
+------------------+
|uniform(5, 105, 3)|
+------------------+
|                30|
|                71|
|                99|
|                77|
|                16|
|                25|
|                89|
|                80|
|                51|
|                83|
+------------------+