Collecte des entrées utilisateur

Avec la publication de l’action Azure Communication Services Call Automation Recognize, les développeurs peuvent désormais enrichir leurs applications IVR ou de centre de contact afin de reconnaître les saisies des utilisateurs. L’un des scénarios de reconnaissance les plus fréquents consiste à diffuser un message invitant l’utilisateur à fournir une réponse, laquelle est ensuite interprétée par l’application. Une fois la réponse identifiée, l’application exécute l’action correspondante. Les entrées des appelants peuvent être recueillies de différentes façons, notamment par DTMF (saisie utilisateur via les chiffres de leur appareil d’appel), par la voix ou par une combinaison des deux.

Reconnaissance vocale avec conversion de la parole en texte

L’intégration d’Azure Communications Services à Foundry Tools vous permet de parcourir l’action Recognize pour analyser l’audio en temps réel pour transcrire le mot parlé en texte. Microsoft s’appuie sur un modèle linguistique universel comme modèle de base, entraîné à partir de données appartenant à Microsoft et représentant les langues couramment parlées. Ce modèle est préentraîné avec des dialectes et des caractéristiques phonétiques couvrant divers domaines usuels. Pour obtenir davantage d’informations sur les langues prises en charge, consultez Langues et prise en charge vocale pour le service Speech.

DTMF

La reconnaissance multifréquence à deux tons (DTMF) correspond au processus d’interprétation des tonalités ou sons générés par un téléphone lors de la composition d’un numéro. L’équipement côté réception qui écoute la tonalité spécifique convertit ensuite ces signaux en commandes. Ces commandes signalent généralement l’intention de l’utilisateur lorsqu’il navigue dans un menu dans le cadre d’un scénario d’IVR ou, dans certains cas, peuvent être utilisées pour capturer des informations importantes que l’utilisateur doit fournir via son clavier téléphonique.

Événements DTMF et tonalités associées

Événement Ton
0 Zéro
1 Un
2 Deux
3 Trois
4 Quatre
5 Cinq
6 Six
7 Sept
8 Huit
9 Neuf
Un Un
B B
C C
D D
* Astérisque
# Dièse

Cas d’utilisation courants

L’action de reconnaissance peut être exploitée pour de nombreux cas d’usage. Voici quelques exemples illustrant la manière dont les développeurs peuvent intégrer l’action de reconnaissance dans leur application.

Améliorer le parcours utilisateur avec des invites en libre-service

  • Les utilisateurs peuvent contrôler l’appel – En activant la reconnaissance vocale, vous permettez à l’appelant de naviguer dans votre menu IVR et de fournir des informations qui peuvent être utilisées pour répondre à sa demande.
  • Collecte d’informations sur les utilisateurs – En activant la reconnaissance des entrées, votre application peut recueillir les informations fournies par les appelants. Il peut s’agir d’informations telles que les numéros de compte, les informations de carte de crédit, etc.
  • Transcription des réponses des appelants – Grâce à la reconnaissance vocale, vous pouvez recueillir l’entrée utilisateur, transcrire l’audio en texte et l’analyser afin de mener à bien des actions commerciales spécifiques.

Interrompre les invites audio

L’utilisateur peut quitter le menu IVR et parler à un agent humain – Grâce à l’interruption DTMF, votre application peut permettre aux utilisateurs d’interrompre le flux du menu IVR et de discuter avec un agent humain.

Exemple d’architecture pour la collecte des entrées utilisateur dans un appel avec reconnaissance vocale

Diagramme présentant un exemple d’architecture pour l’action AI Reconnaître.

Exemple d’architecture pour la collecte d’entrées utilisateur dans un appel

Action Recognize

Limitation connue

  • Le DTMF intrabande n’est pas pris en charge ; utilisez le DTMF RFC 2833 à la place.
  • Les invites de texte de synthèse vocale prennent en charge un maximum de 4 000 caractères, si votre invite est plus longue que celle-ci, nous vous suggérons d’utiliser SSML pour les actions de lecture basées sur la synthèse vocale.
  • Lorsque l’enregistrement est activé, l’entrée vocale est enregistrée pour les appels 1:1, mais n’est pas enregistrée dans les appels de groupe.
  • Si vous dépassez votre limite de quota de service Speech, vous pouvez demander une augmentation de cette limite en suivant les étapes décrites ici.

Étapes suivantes