NEAREST_BY_JOIN 错误条件

SQLSTATE:42604

最接近的联接无效。

CROSS_JOIN_NOT_ENABLED

最近的联接在内部实现为有限跨积,因此在以下情况下 spark.sql.crossJoin.enabled = false被拒绝。 将 spark.sql.crossJoin.enabled = true 设置为允许此操作,或在不使用 nearest-by 的情况下重写查询。

带有非确定性表达式的精确匹配

EXACT 最接近的联接与非确定性排名表达式 <expression>不兼容。 使用 APPROX或将表达式替换为确定性表达式。

NON_ORDERABLE_RANKING_EXPRESSION

类型为<type>的排名表达式<expression>不可排序。 提供返回可排序类型的表达式,例如数字距离(如 abs(a.col - b.col)或数值相似性分数。

NUM_RESULTS_OUT_OF_RANGE

结果 <numResults> 数必须介于 <min><max>之间。 将 APPROX NEAREST <numResults> BY ...(或 EXACT NEAREST <numResults> BY ...)中的字面量更新为落在该范围内。

STREAMING_NOT_SUPPORTED

流式处理数据帧/数据集不支持最近的联接。

UNSUPPORTED_DIRECTION

不支持“<direction>”这种最近邻联接方向。 支持的最近联接方向包括: <supported>

UNSUPPORTED_JOIN_TYPE

不支持最近邻连接类型 <joinType>。 支持的类型: <supported>.

UNSUPPORTED_MODE

不受支持的最近邻联接模式“<mode>”。 支持的模式包括: <supported>