validate_utf8 函数

适用于: Databricks SQL 勾选标记为“是” Databricks Runtime 15.4 及更高版本check marked yes

如果它对应于有效的 UTF-8 字符串,则返回输入值,否则将引发 INVALID_UTF8_STRING

语法

validate_utf8(strExpr)

参数

  • strExpr:一个 STRING 表达式。

返回

如果 STRING 字节表示有效的 UTF-8 字符串,则为字节相等 strExpr ,否则将引发 INVALID_UTF8_STRING

若要返回 NULL 输入不是有效的 UTF-8 字符串,请使用 try_validate_utf8 函数。

常见错误条件

示例

-- Simple example taking a valid string as input.
> SELECT validate_utf8('Spark')
  Spark

-- Simple example taking a valid collated string as input.
> SELECT validate_utf8('SQL' COLLATE UTF8_LCASE)
  SQL

-- Simple example taking a valid hexadecimal string as input.
> SELECT validate_utf8(x'61')
  a

-- Example taking an invalid hexadecimal string as input (illegal UTF-8 byte sequence).
> SELECT validate_utf8(x'80')
  Error: INVALID_UTF8_STRING