Maskininlärning på Azure Databricks

Skapa, distribuera och hantera maskininlärningsprogram på Azure Databricks. Den integrerade plattformen förenar hela ML-livscykeln från förberedelse av data till produktionsövervakning.

Letar du efter generativ AI och AI-agenter? Se Skapa AI-agenter på Azure Databricks.

Get started

Prova en snabbstart, förbereda dina data eller skapa en modell med låg kod.

Guide Description
Kom igång: Skapa din första maskininlärningsmodell på Databricks Skapa en enkel klassificeringsmodell med scikit-learn från slutpunkt till slutpunkt.
AutoML Skapa automatiskt högkvalitativa modeller med minimal kod med hjälp av automatiserad funktionsutveckling och justering av hyperparametrar.
Läsa in data för maskininlärning och djupinlärning Läsa in och förbereda data för ML- och djupinlärningsarbetsflöden.
Träna rekommenderade modeller Träna en rekommendationsmodell med tvåtornsarkitekturen eller DLRM-arkitekturen.

Träna klassiska maskininlärningsmodeller

Skapa maskininlärningsmodeller med automatiserade verktyg och samarbetsmiljöer för utveckling.

Feature Description
Databricks Runtime för ML Förkonfigurerade kluster med scikit-learn, XGBoost, MLflow och andra ML-bibliotek samt stöd för ramverk för djupinlärning.
MLflow-spårning Spåra experiment, jämföra modellprestanda och hantera hela livscykeln för modellutveckling.
Funktionsutveckling Skapa, hantera och tillhandahåll funktioner med automatiserade data-pipelines och upptäckande av funktioner.
Databricks-notebook-filer Samarbetsutvecklingsmiljö med stöd för Python-, R-, Scala- och SQL för ML-arbetsflöden.

Träna djupinlärningsmodeller

Använd hanterad beräkning och inbyggda ramverk för att utveckla djupinlärningsmodeller.

Feature Description
Distribuerad utbildning Exempel på distribuerad djupinlärning med Ray, TorchDistributor och DeepSpeed.
AI Runtime Serverlös GPU-beräkning för anpassad djupinlärningsträning och slutsatsdragningsarbetsbelastningar.
Metodtips för DL Vägledning för ramverksval, datainläsning, distribuerad skalning och hantering av livscykeln för djupinlärningsmodellen.
PyTorch Enkelnod och distribuerad träning med PyTorch.

Distribuera och hantera modeller

Distribuera modeller till produktion med skalbara slutpunkter, slutsatsdragning i realtid och övervakning i företagsklass.

Feature Description
Modelltjänst Distribuera anpassade modeller och LLM:er som skalbara REST-slutpunkter med stöd för automatisk skalning och GPU.
AI Gateway Styra och övervaka åtkomsten till modeller som hanteras på Azure Databricks med användningsspårning, nyttolastloggning och säkerhetskontroller.
Externa modeller Integrera modeller från tredje part som finns utanför Databricks med enhetlig styrning och övervakning.
API:er för grundmodell Få åtkomst till och fråga efter toppmoderna öppna modeller som hanteras av Databricks.

Övervaka och styra ML-system

Säkerställa modellkvalitet, dataintegritet och efterlevnad med omfattande övervaknings- och styrningsverktyg.

Feature Description
Unity-katalog Styr data, funktioner, modeller och funktioner med enhetlig åtkomstkontroll, ursprungsspårning och identifiering.
Dataprofilering Övervaka datakvalitet, modellprestanda och prediktionsavvikelser med automatiserade aviseringar och grundorsaksanalys.
Avvikelseidentifiering Övervaka datas färskhet och fullständighet på katalognivå.
MLflow för modeller Spåra experiment, hantera modeller i Unity Catalog, distribuera och utvärdera maskininlärningsmodeller under hela utvecklingslivscykeln.

Produktionsanpassa ML-arbetsflöden

Skala maskininlärningsåtgärder med automatiserade arbetsflöden, CI/CD-integrering och produktionsklara pipelines.

Feature Description
Modeller i Unity-katalogen Använd modellregistret i Unity Catalog för centraliserad styrning och för att hantera modellens livscykel, inklusive distributioner.
Lakeflow-jobb Skapa automatiserade arbetsflöden och produktionsklara ETL-pipelines för ML-databearbetning.
Ray på Databricks Skala ML-arbetsbelastningar med distribuerad databehandling för storskalig modellträning och slutsatsdragning.
MLOps-arbetsflöden Implementera MLOps från slutpunkt till slutpunkt med automatiserade tränings-, testnings- och distributionspipelines.