Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Retourneert een nieuwe DataFrame waarde waarin null-waarden worden gevuld met een nieuwe waarde.
DataFrame.fillna en DataFrameNaFunctions.fill zijn aliassen van elkaar.
Syntaxis
fill(value, subset=None)
Parameterwaarden
| Kenmerk | Typ | Beschrijving |
|---|---|---|
value |
int, float, str, bool of dict | De waarde voor het vervangen van null-waarden door. Als er een dict wordt opgegeven, subset wordt deze genegeerd en value moet het een toewijzing van de kolomnaam naar een vervangende waarde zijn. Vervangingswaarden moeten int, float, bool of str zijn. |
subset |
str, tuple of list, optioneel | Kolomnamen die u moet overwegen. Kolommen waarvoor subset geen overeenkomend gegevenstype value is, worden genegeerd. |
Retouren
DataFrame
Examples
df = spark.createDataFrame([
(10, 80.5, "Alice", None),
(5, None, "Bob", None),
(None, None, "Tom", None),
(None, None, None, True)],
schema=["age", "height", "name", "bool"])
Vul alle null-waarden in met 50 voor numerieke kolommen.
df.na.fill(50).show()
# +---+------+-----+----+
# |age|height| name|bool|
# +---+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| 50.0| Bob|NULL|
# | 50| 50.0| Tom|NULL|
# | 50| 50.0| NULL|true|
# +---+------+-----+----+
Vul alle null-waarden in voor False Booleaanse kolommen.
df.na.fill(False).show()
# +----+------+-----+-----+
# | age|height| name| bool|
# +----+------+-----+-----+
# | 10| 80.5|Alice|false|
# | 5| NULL| Bob|false|
# |NULL| NULL| Tom|false|
# |NULL| NULL| NULL| true|
# +----+------+-----+-----+
Vul null-waarden in met 50 voor age en "unknown" voor name.
df.na.fill({'age': 50, 'name': 'unknown'}).show()
# +---+------+-------+----+
# |age|height| name|bool|
# +---+------+-------+----+
# | 10| 80.5| Alice|NULL|
# | 5| NULL| Bob|NULL|
# | 50| NULL| Tom|NULL|
# | 50| NULL|unknown|true|
# +---+------+-------+----+
Vul alle null-waarden in voor "Spark" de name kolom.
df.na.fill(value='Spark', subset='name').show()
# +----+------+-----+----+
# | age|height| name|bool|
# +----+------+-----+----+
# | 10| 80.5|Alice|NULL|
# | 5| NULL| Bob|NULL|
# |NULL| NULL| Tom|NULL|
# |NULL| NULL|Spark|true|
# +----+------+-----+----+