Information om frågeprestanda

Viktigt!

Den här funktionen är en privat förhandsversion. Kontakta din Azure Databricks-kontakt om du vill prova det.

När frågor körs kan Databricks returnera insikter som identifierar möjligheter att förbättra prestanda. På den här sidan visas de insikter som stöds och deras innebörd.

En bredare översikt över metodtips för prestanda finns i den omfattande guiden för att optimera arbetsbelastningar i Databricks, Spark och Delta Lake.

Samtidig_Skrivning

  • Samtidiga skrivningar i tabellen orsakar konflikter som löses automatiskt eller misslyckas.
  • Rekommendation: Granska deltahistoriken för att identifiera samtidiga skrivningar och överväg olika schemaläggningar för att undvika konflikter.

COVERAGE_FILTER_KEYS_CLUSTERING

  • Tabellen grupperas med en eller flera nycklar som inte används vid filtrering under tabellgenomsökningen.
  • Rekommendation: Ta reda på vilken datadeluppsättning du behöver för önskat resultat och lägg sedan till filter på matchande klusternycklar för att minska läsningen av byte.

COVERAGE_FILTER_KEYS_PARTITIONING

  • Tabellen partitioneras av en eller flera nycklar som inte används i filtreringen under tabellgenomsökningen.
  • Rekommendation: Bestäm vilken dataunderuppsättning du behöver för önskat resultat och lägg sedan till filter på matchande partitioneringsnycklar för att minska läsningen av byte.

COVERAGE_PHOTON

  • Photon kan inte accelerera operationen, så standardkörningsmotorn användes.
  • Rekommendation: Granska Photon-begränsningar och överväg att justera frågan så att den använder en exekveringsstrategi som stöds för snabbare exekvering.

TÄCKNINGSSTATISTIK_DELTA

  • Deltadata som hoppar över statistik saknas eller är ofullständiga för filfilter för tabellgenomsökning, så frågan använder filfiltrering. Följande statistikstatusar är möjliga:
    • Fullständig: Statistik är tillgänglig för alla filter.
    • Partiell: Statistik är tillgänglig för en delmängd av filter.
    • Ej tillgänglig: Statistik är inte tillgänglig för något filter.
    • Oanvänd: Det gick inte att använda statistik på ett filter som konverterar datatypen.
  • Rekommendation: Samla in deltastatistik för att minska antalet lästa byte.

COVERAGE_STATS_OPTIMIZER

DATA_SKEW

  • Data bearbetas ojämnt av tillgängliga databehandlingsresurser.
  • Rekommendation: Granska fördelningen av data, sedan saltera nycklar eller föraggregera informationen.

DATA_SPILL

  • Dataspill till disk när en operatör körs eftersom datastorleken inte fick plats i minnet.
  • Rekommendation: Öka lagerstorleken för att öka tillgängligt minne. Minska antalet rader, antalet kolumner eller storleken på en stor kolumn (strängar, matriser, kartor, structs) för att minska minnesanvändningen.

EXCESSIVE_QUEUE_TIME

  • Frågan har väntat i kön på lagret.
  • Rekommendation: Öka det maximala antalet kluster i lagret för att minska kötiden.

EXPLODING_JOIN

  • Joingenererar betydligt fler rader än den har läst.
  • Rekommendation: Bestäm vilken resultatunderuppsättning som krävs och uppdatera sedan sammanslagningen eller minska antalet indatarader från båda relationerna.

FLOW_FULL_RECOMPUTE

I/O-begränsning

  • Molnlagringsbegäran begränsades av molnleverantören.
  • Rekommendation: Kontakta administratören för att öka gränsen för molnlagringsbegäran med molnleverantören.

REDUNDANT_AGGREGATION

SELECTIVE_JOIN

  • Join genererar betydligt färre rader än den har läst.
  • Rekommendation: Bestäm vilken resultatunderuppsättning som krävs och lägg sedan till filter före kopplingen för att minska antalet indatarader.

WIDE_PROJECTION

  • Projicera alla kolumner i tabellen.
  • Rekommendation: Bestäm vilken resultatunderuppsättning som krävs och projicera sedan endast dessa kolumner för att minska antalet lästa byte.