csv (DataFrameWriter)

将 CSV 格式的内容 DataFrame 保存在指定路径处。

Syntax

csv(path, mode=None, compression=None, sep=None, quote=None, escape=None,
    header=None, nullValue=None, escapeQuotes=None, quoteAll=None,
    dateFormat=None, timestampFormat=None, ignoreLeadingWhiteSpace=None,
    ignoreTrailingWhiteSpace=None, charToEscapeQuoteEscaping=None,
    encoding=None, emptyValue=None, lineSep=None)

参数

参数 类型 说明
path str 任何 Hadoop 支持的文件系统中的路径。
mode str,可选 数据已存在时的行为。 接受的值是 'append''overwrite''ignore''error''errorifexists' (默认值)。

退货

没有

示例

将数据帧写入 CSV 文件,并将其读回。

import tempfile
with tempfile.TemporaryDirectory(prefix="csv") as d:
    df = spark.createDataFrame([{"age": 100, "name": "Alice"}])
    df.write.csv(d, mode="overwrite")

    spark.read.schema(df.schema).format("csv").option(
        "nullValue", "Alice").load(d).show()
    # +---+----+
    # |age|name|
    # +---+----+
    # |100|NULL|
    # +---+----+