Was sind Windows AI APIs?

Abbildung der Symbole für verschiedene Windows AI APIs.

Windows KI Foundry stellt eine Vielzahl von Funktionen für künstliche Intelligenz (KI) über eine Suite von Windows KI-APIs und hardwareabstrahierten KI-Inferenzfunktionen bereit, die durch Windows Machine Learning (ML) ermöglicht werden. Die Windows AI APIs ermöglicht KI-Fähigkeiten, ohne dass Sie ein eigenes ML-Modell (Machine Learning) finden, ausführen oder optimieren müssen. Die Modelle, die Windows AI Foundry antreiben, werden lokal auf unterstützten Windows 11-Geräten ausgeführt – einschließlich Copilot+ PCs mit NPUs, Geräten mit unterstützten GPUs und Geräten, die die empfohlenen CPU-Spezifikationen erfüllen – und können kontinuierlich im Hintergrund ausgeführt werden.

Unterstützte Hardware

Windows AI APIs erweitern sich über Copilot+ PCs hinaus, um eine breitere Palette von Hardware zu unterstützen. Die folgende Tabelle zeigt die aktuelle Hardwareunterstützung für die einzelnen API.

Hinweis

Auf einem Copilot+-PC werden unterstützte APIs immer auf der NPU ausgeführt. Die Spalten GPU und CPU beschreiben die Erweiterung auf Nicht-Copilot+-Geräte – sie sind keine alternativen Back-Ends, die Sie für eine Copilot+ PC aktivieren können.

API NPU (Copilot+ PC) Grafikprozessor (GPU) CPU
Phi-Silika ✅ Verfügbar ✅ Verfügbar (ausgewählte GPUs) ❌ Nicht unterstützt
Texterkennung (OCR) ✅ Verfügbar ❌ Nicht unterstützt ❌ Nicht unterstützt
Spracherkennung ✅ Verfügbar ❌ Nicht unterstützt ✅ Verfügbar (optional, abnehmbar)
Video-Superauflösung ✅ Verfügbar ❌ Nicht unterstützt ✅ Verfügbar
Superauflösung für Bilder ✅ Verfügbar ❌ Nicht unterstützt ❌ Nicht unterstützt
Bildbeschreibung ✅ Verfügbar ❌ Nicht unterstützt ❌ Nicht unterstützt
Bildsegmentierung ✅ Verfügbar ❌ Nicht unterstützt ❌ Nicht unterstützt
Objektlöschung ✅ Verfügbar ❌ Nicht unterstützt ❌ Nicht unterstützt
Bilderzeugung ✅ Verfügbar (optional, entfernbar) ❌ Nicht unterstützt ❌ Nicht unterstützt

Hinweis

GPU-Unterstützung für Phi Silica ist derzeit auf NVIDIA GPUs (RTX 30-Serie und neuer mit 6+ GB vRAM) verfügbar. Amd GPU-Unterstützung wird in Kürze verfügbar sein. Gpu-Ableitung erfordert, dass der Entwicklermodus aktiviert ist (Einstellungssystem>>für Entwickler) und der neueste GPU-Treiber, der direkt vom Hersteller installiert ist (siehe Phi Silica – GPU-Treiberanforderungen). Die Video-Superauflösung und die Spracherkennung werden auf allen CPU-Geräten ausgeführt, die jedoch die empfohlenen Spezifikationen erfüllen (4 physische Kerne, 3 GHz oder höher, 32 MB oder mehr L3-Cache). Auf den einzelnen API-Seiten finden Sie Einzelheiten und eine Laufzeitüberprüfung.

Modellverfügbarkeit

Die Art und Weise, wie das zugrunde liegende KI-Modell ein Gerät erreicht, hängt von den APIfolgenden Faktoren ab:

  • Phi Silica – Auf Copilot+ PCs ist das Modell preinstalliert auf der NPU. Auf GPU- und CPU-Geräten ist das Modell nicht vorinstalliert — es wird bei Bedarf heruntergeladen, wenn Ihre App EnsureReadyAsync zum ersten Mal aufruft. Downloads können mehrere GB sein und im Hintergrund über Windows Update ausgeführt werden. Endbenutzer können das Modell unter "Settings>System>AI Components" entfernen oder erneut installieren. Apps sollten zuerst GetReadyState prüfen und einen Einwilligungsdialog anzeigen, bevor sie den Download auslösen. Siehe Phi Silica – Modellverfügbarkeit und Download für das empfohlene UX-Muster.
  • AI Image Generation – Wird nur auf der NPU ausgeführt, aber das Modell ist aufgrund seiner Installationsgröße nicht vorinstalliert . Sie wird bei Bedarf heruntergeladen, wenn Ihre App EnsureReadyAsync zum ersten Mal aufruft, und Nutzer können sie später unter Einstellungen>System>AI Components entfernen. Apps sollten zuerst GetReadyState prüfen und ein Einwilligungsdialogfeld anzeigen, bevor der Download gestartet wird. Siehe AI Image Generation – Modellverfügbarkeit und Download für das empfohlene UX-Muster.
  • Video Super Resolution – Das VSR-Modell wird mit dem Windows App SDK auf jedem unterstützten Hardwarepfad ausgeliefert. Es gibt keinen Download beim ersten Start, keinen Einwilligungsschritt und kein entfernbares Modell. Siehe Video Super Resolution – Empfohlene CPU-Spezifikationen.
  • Speech Recognition – Bei Copilot+ PCs ist das Modell preinstalliert auf der NPU. Auf nur CPU-Geräten ist das Modell nicht vorinstalliert – es wird bei Bedarf heruntergeladen, wenn Ihre App zum ersten Mal aufruftEnsureReadyAsync, und Benutzer können es später bei "Settings>>" entfernen. Apps sollten GetReadyState zuerst prüfen und einen Zustimmungsdialog anzeigen, bevor der Download auf der CPU gestartet wird. Siehe Spracherkennung – Modellverfügbarkeit und Download für das empfohlene UX-Muster.

In der Windows AI APIs mit WinUI-Beispiel-App finden Sie Informationen zur Verwendung Microsoft Foundry on Windows mit WinUI.

Von Bedeutung

Nachfolgend finden Sie eine Liste der Windows AI-Features und der Windows App SDK-Version, in der sie derzeit unterstützt werden. Kurzbeschreibungen finden Sie in der Übersicht über die weiter unten in diesem Thema verfügbaren APIs Informationen.

[Version 2.2.2-experimental9 (Experimentell, Juni 2026)] - Phi Silica auf der GPU (erfordert einen Build des Windows Insider Experimental Channel)

Version 1.8.0 (1.8.250907003) - Phi Silica (Eingeschränkter Zugriff), Konversationszusammenfassung (Textintelligenz), Objekte entfernen

Version 1.8 Preview (1.8.0-preview) - LoRA Fine-Tuning für Phi Silica, Text Rewriter Tone (Text Intelligence)

Private Vorschau – Semantiksuche

Version 1.7.1 (1.7.250401001) – Alle anderen APIs

Erstellen Ihrer ersten KI-basierten Windows-App

Tipp

Um die Barrierefreiheit und Lesbarkeit zu verbessern, zeigt diese Seite standardmäßig weiterhin Bilder an. In einigen Fällen können Sie auf ein Bild klicken, um eine animierte Version anzuzeigen.

Um Ihre erste Windows-App mit Visual Studio und einigen einfachen Windows AI APIszu erstellen, erfüllen Sie einfach die Voraussetzungen, und verwenden Sie den bereitgestellten Beispielcode in "Erste Schritte beim Erstellen einer App mit Windows AI APIs".

Von dort aus können Sie zu kurzen Tutorials springen, in denen eine App unter Verwendung spezifischer Windows-KI erstellt wird. APIs wie beispielsweise Phi Silica Walkthrough, Abbild-Durchlauf und OCR-Durchlauf.

Testen von APIs und Modellen auf Ihrem PC

AI Dev Gallery ist eine Demo-App , die im Microsoft Store verfügbar ist, mit der Sie Windows AI APIs und Modelle schnell herunterladen, ausprobieren und verwenden können.

In AI Dev Gallery, wählen Sie den Windows KI APIs Registerkarte und wählen Sie dann den Menüpunkt Phi Silica Beispiel. Wenn das Modell bereits auf Ihrem Gerät verfügbar ist, wird dieses Beispiel sofort ausgeführt. Wählen Sie andernfalls "Modell anfordern " aus, um das Modell herunterzuladen. Nach dem Herunterladen wird dieses Beispiel aktiviert. Erfahren Sie mehr über AI Dev Gallery in Was ist AI Dev Gallery?.

Übersicht über die verfügbaren APIs

Hier sind einige einsatzbereite KI-Features, die Sie aus Ihrer Windows-App nutzen können:

Phi-Silika

Ähnlich wie bei großsprachigen Modellen (LLM) ist Phi Silica ein von Microsoft Research entwickeltes Small Language Model (SLM), um Sprachverarbeitungsaufgaben auf einem lokalen Gerät durchzuführen (siehe Get started with Phi Silica). Phi Silika ist für Windows Geräte mit einer neuralen Verarbeitungseinheit (Neural Processing Unit, NPU) oder einer unterstützten GPU konzipiert, sodass Textgenerierungs- und Unterhaltungsfunktionen auf leistungsstarke, hardwarebeschleunigte Weise direkt auf dem Gerät ausgeführt werden können. Phi Silika ist in China nicht verfügbar.

Ein animiertes GIF zeigt eine KI-Chataufforderung mit dem Text

Texterkennung

Die Texterkennung APIs ermöglicht die Erkennung von Text in einem Bild und die Konvertierung auf einem lokalen Gerät verschiedener Arten von Dokumenten (z. B. gescannte Papierdokumente, PDF-Dateien und Bilder, die von einer Digitalkamera erfasst werden) in bearbeitbare und durchsuchbare Daten (siehe Erste Schritte mit der KI-Texterkennung).

Eine animierte GIF mit Wörtern in einem Screenshot, die mit Textüberlagerungen erkannt werden, die mithilfe der Texterkennungsfunktion in eine Datei oder Zwischenablage kopiert werden können.

Bildgebung

Skalieren und schärfen Sie Bilder (Bild-Superauflösung), identifizieren Sie Objekte innerhalb eines Bilds (Image Object Extractor), generieren Sie natursprachliche Beschreibungen von Bildern (Bildbeschreibung), und entfernen Sie Objekte aus Bildern (Objektlöschung). Weitere Informationen finden Sie unter "Erste Schritte mit KI-Imageerstellung".

Superauflösung für Bilder

Die Bild-Superauflösung APIs ermöglicht das Schärfen und Skalieren von Bildern.

Animiertes GIF mit der Darstellung einer Kombination aus Wörtern und Bildern, die mithilfe der Bildauflösungsfunktion schärfer gemacht und skaliert wird

Siehe auch Bild-Superauflösung.

Bildobjektextraktion

Mit dem Bildobjektextraktionsmodul APIs können Objekte innerhalb von Bildern identifiziert werden.

Ein animiertes GIF mit einem Mann, der einen Fuß vom Boden entfernt, und wählen Sie dann

Siehe auch Image Object Extractor.

Bildbeschreibung

Die Bildbeschreibung APIs beschreibt Bilder in natürlicher Sprache.

Hinweis

Bildbeschreibungsfeatures sind in China nicht verfügbar.

Ein animiertes GIF zeigt einen schlafenden Hund und blendet eine Bildbeschreibung ein, die mit natürlicher Sprache einen flauschigen, zottelhaarigen Hund beschreibt, der bequem auf einer Couch liegt, und nutzt dabei die Bildbeschreibungsfunktion.

Siehe auch Bildbeschreibung

Objektlöschung

Sie können das Objektlöschen APIs verwenden, um Objekte aus Bildern zu entfernen.

Ein animiertes GIF mit einem Bild, in dem der Benutzer Objekte aus der Objektlöschfunktion entfernt.

Siehe auch Objektlöschung

Zusätzliche KI-Features

  • Liveübersetzung (noch nicht unterstützt). Helfen Sie allen Benutzern bei der Verwendung von Windows , einschließlich derjenigen, die taub oder schwerhörig sind, die Audiodaten besser zu verstehen, indem Sie Untertitel gesprochener Inhalte anzeigen (auch wenn sich der Audioinhalt in einer Sprache befindet, die sich von der bevorzugten Sprache des Systems unterscheidet).

Inhaltsmoderation

Erfahren Sie, wie Inhalte von der Windows AI APIsmoderiert werden und wie Sie Vertraulichkeitsfilter anpassen können. Siehe Inhaltssicherheitsmoderation mit der Windows-KI APIs.

Wenn Sie KI-Features verwenden, empfehlen wir Ihnen, den folgenden Abschnitt zu lesen: Entwicklung verantwortungsbewusster generativer KI-Anwendungen und Features unter Windows.

Zusätzliche Ressourcen

Siehe auch