Einleitung

Abgeschlossen

Azure Speech in Foundry Tools stellt APIs bereit, die Sie zum Erstellen von sprachfähigen Anwendungen verwenden können, einschließlich:

  • Sprache zu Text: Eine API, die die Spracherkennung ermöglicht, in der Ihre Anwendung gesprochene Eingaben akzeptieren kann.
  • Text zu Sprache: Eine API, die sprachsynthese ermöglicht, in der Ihre Anwendung gesprochene Ausgaben bereitstellen kann.
  • Sprachübersetzung: Eine API, mit der Sie gesprochene Eingaben in mehrere Sprachen übersetzen können.
  • Voice Live: Eine API, die Sie verwenden können, um KI-Agents zu erstellen, die in der Lage sind, Echtzeitunterhaltungen durchzuführen.

Dieses Modul konzentriert sich auf die Spracherkennung und Sprachsynthese, die Kernfunktionen jeder sprachfähigen Anwendung sind.

Die Codebeispiele in diesem Modul werden in Python bereitgestellt, Sie können jedoch jedes der verfügbaren Azure Speech SDK-Pakete verwenden, um Spracherkennungsfähige Anwendungen in Ihrer bevorzugten Sprache zu entwickeln. Zu den verfügbaren SDK-Paketen gehören:

Note

Wir erkennen, dass verschiedene Menschen gerne auf unterschiedliche Weise lernen. Sie können dieses Modul im videobasierten Format abschließen oder den Inhalt als Text und Bilder lesen. Der Text enthält größere Details als die Videos. In einigen Fällen sollten Sie also auf den Text als ergänzendes Material für die Videopräsentation verweisen.