Introdução
A transcrição e síntese de fala são capacidades úteis em muitos cenários, incluindo:
- Documentar conversas faladas em chamadas e reuniões.
- Gerar legendas para vídeos ou apresentações.
- Criar interfaces de utilizador audíveis para melhorar a acessibilidade das aplicações.
- Desenvolver assistentes de IA sem as mãos que leem as mensagens de texto ou os emails em voz alta.
Neste módulo, vamos explorar como usar modelos de IA generativa com capacidade de fala no Microsoft Foundry para converter fala em texto e texto em fala.
Note
Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Pode optar por completar este módulo em formato de vídeo ou pode ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, você pode querer se referir a ele como material complementar à apresentação do vídeo.