Dela via


Funktion ai_summarize

Gäller för:markerad ja Databricks SQL markerad ja Databricks Runtime

Viktigt!

Den här funktionen är i offentlig förhandsversion och HIPAA-kompatibel.

Under förhandsversionen:

Med funktionen ai_summarize() kan du anropa en toppmodern generativ AI-modell för att generera en sammanfattning av en viss text med hjälp av SQL. Den här funktionen använder en chattmodell som serverar en slutpunkt tillgängliggjord av Databricks Foundation Model API:er.

Krav

Apache 2.0-licens

De underliggande modeller som kan användas just nu är licensierade under Apache 2.0-licensen, Copyright © Apache Software Foundation. Kunderna ansvarar för att säkerställa efterlevnaden av tillämpliga modelllicenser.

Databricks rekommenderar att du granskar dessa licenser för att säkerställa efterlevnad av tillämpliga villkor. Om modeller dyker upp i framtiden som presterar bättre enligt Databricks interna riktmärken kan Databricks ändra modellen (och listan över tillämpliga licenser som tillhandahålls på den här sidan).

  • Den här funktionen är endast tillgänglig på arbetsytor i regioner som stöder AI Functions som är optimerade för batchinferens.
  • Den här funktionen är inte tillgänglig i Azure Databricks SQL Classic.
  • Kontrollera prissättningssidan för Databricks SQL.
  • Batch-slutsatsdragningsarbetsbelastningar kräver Databricks Runtime 15.4 ML LTS för bättre prestanda.

Syntax

ai_summarize(content[, max_words])

Argumenten

  • content: Ett STRING uttryck, texten som ska sammanfattas.
  • max_words: Ett valfritt icke-negativt numeriskt uttryck som representerar det målsatta antalet ord i den returnerade sammanfattningstexten. Standardvärdet är 50. Om värdet är 0 finns det ingen ordgräns.

Returer

En STRING.

Om content är NULL, är NULL resultatet.

Exempel

> SELECT ai_summarize(
    'Apache Spark is a unified analytics engine for large-scale data processing. ' ||
    'It provides high-level APIs in Java, Scala, Python and R, and an optimized ' ||
    'engine that supports general execution graphs. It also supports a rich set ' ||
    'of higher-level tools including Spark SQL for SQL and structured data ' ||
    'processing, pandas API on Spark for pandas workloads, MLlib for machine ' ||
    'learning, GraphX for graph processing, and Structured Streaming for incremental ' ||
    'computation and stream processing.',
    20
  );
 "Apache Spark is a unified, multi-language analytics engine for large-scale data processing
 with additional tools for SQL, machine learning, graph processing, and stream computing."