Compreender a análise de texto no Foundry

Concluído

Observação

Consulte a guia Texto e imagens para obter mais detalhes!

Microsoft Foundry é a plataforma para construir aplicações e agentes de IA em Azure. O portal Foundry oferece duas abordagens à análise de texto: modelos de IA de uso geral que lidam com uma vasta gama de tarefas através de prompts em linguagem natural, e ferramentas de linguagem construídas para um propósito que devolvem resultados estruturados e determinísticos para tarefas específicas.

Observação

A Foundry tem um portal web onde pode construir, testar e implementar aplicações de IA. O portal tem duas interfaces de utilizador (UIs) — uma interface clássica e uma nova UI — o novo portal Foundry. Este conteúdo descreve as capacidades do novo portal Foundry.

Para começar com a análise de texto no novo portal Foundry, precisa de criar um recurso Foundry e um projeto Foundry.

Um recurso Foundry é um recurso Azure que fornece acesso a serviços de IA e modelos implementados. Um projeto Foundry é um espaço de trabalho dentro desse recurso onde organiza o seu trabalho, implementa modelos e acede a ferramentas como o chat playground e serviços de IA.

Utilização de modelos de IA de uso geral para análise de texto

A partir do seu projeto no portal Foundry, pode implementar um modelo de IA de propósito geral. Um modelo de IA de uso geral é um modelo de linguagem treinado com grandes quantidades de dados textuais, conferindo-lhe uma compreensão ampla da linguagem e a capacidade de lidar com muitas tarefas diferentes. Um modelo de uso geral pode seguir instruções em linguagem natural para analisar sentimentos, extrair entitates, resumir texto, traduzir conteúdos, responder a perguntas e muito mais — tudo isto sem qualquer configuração ou formação da sua parte.

Pode usar um modelo de IA de uso geral para lidar com tarefas de análise de texto tais como:

  • A extração de frases-chave lista os principais conceitos de texto não estruturado.
  • A vinculação de entidades identifica entidades conhecidas juntamente com um link para a Wikipédia.
  • A análise de sentimento e a mineração de opinião identificam se o texto é positivo ou negativo.
  • O resumo resume o texto identificando as informações mais importantes.

Pode explorar as capacidades de análise de texto dos modelos de IA no parque de conversas do portal Foundry. Depois de implementar um modelo, o playground dá-te uma interface de chat onde escreves um prompt e o modelo responde. Como o modelo compreende o contexto, também pode fazer perguntas adicionais ou refinar a análise na mesma conversa. Isto torna o playground uma forma útil de explorar o que é possível antes de construir uma aplicação completa.

Captura de ecrã do novo playground do portal Foundry mostrando a extração de palavras-chave.

Vamos analisar mais de perto algumas das respostas que um modelo de IA de uso geral pode dar quando recebe uma tarefa de análise de texto.

Extração de frases-chave

Pode usar um modelo de linguagem para extrair as palavras-chave e expressões usadas em algum texto, o que pode ser útil em processos como indexação e pesquisa de documentos relevantes. A extração de palavras-chave identifica os pontos principais do texto.

Por exemplo, pode receber uma avaliação como:

"Tive uma refeição fantástica no diner em Seattle no sábado. O risoto de cogumelos estava perfeitamente preparado e realmente saboroso. O nosso empregado, Pete, era simpático e eficiente; E deu-nos uma ótima recomendação para uma sobremesa (cheesecake de morango). Recomendo definitivamente este sítio para um jantar casual."

A extração de frases-chave pode fornecer algum contexto para esta revisão, extraindo as seguintes frases:

  • Jantar informal
  • sobremesa
  • refeição fantástica
  • restaurante
  • Ótima recomendação
  • Risotto de cogumelos
  • Pete
  • lugar
  • Sábado
  • Seattle
  • Cheesecake de morango
  • empregado de mesa

Reconhecimento de entidades

Também pode usar o reconhecimento de entidades nomeadas para encontrar pessoas, lugares, datas e outras entidades específicas mencionadas no texto.

Pode fornecer um modelo de linguagem com texto não estruturado e recuperar uma lista de entidades no texto que este reconhece. Uma entidade é um item de um tipo particular ou uma categoria; e, em alguns casos, subtipo.

Considere este texto curto:

"A 2 de maio de 2017, John Smith visitou Nova Iorque para participar numa conferência organizada por Microsoft. O evento começou às 8:00 da manhã e durou 3 horas. Mais de 25% dos 40 participantes viajaram mais de 10 milhas para participar. "

As entidades detetadas incluem:

Tipo de entidade Subtipo / Categoria Value
Pessoa John Smith
Localização Nova Iorque
Organização Microsoft
DateTime Data 2 de maio de 2017
DateTime Time 08:00
DateTime Duração 3 horas
Quantidade Percentagem 25%
Quantidade Número 40
Quantidade Dimensão 10 milhas

Análise de sentimentos e extração de opiniões

Também pode usar a análise de sentimento para classificar um documento como positivo, negativo ou neutro. Isto é útil para detetar sentimentos nas redes sociais, avaliações de clientes, fóruns de discussão e muito mais.

Considere a seguinte crítica ao restaurante:

"Tive um jantar maravilhoso num bistrô acolhedor em Portland na sexta-feira à noite. O salmão grelhado estava perfeitamente cozinhado e cheio de sabor, e os legumes sazonais eram um ótimo complemento. A nossa empregada, Maria, foi atenciosa e simpática, e sugeriu a tarte de limão para sobremesa—que estava excelente. Recomendo absolutamente este sítio para uma noite descontraída e agradável."

Observação

Como um modelo de IA de uso geral responde a prompts em linguagem natural, o resultado depende de como formula o seu pedido. Por exemplo, pode pedir uma pontuação global de sentimento, ou então pode pedir uma análise frase a frase. Quanto mais específico for o teu prompt, mais estruturada e detalhada será a resposta.

Analisar a crítica ao restaurante pode resultar:

  • Análise do sentimento frase a frase:

    "Tive um jantar maravilhoso num bistrô acolhedor em Portland na sexta-feira à noite." Sentimento: Explicação Positiva: As palavras "jantar maravilhoso" e "bistrô acolhedor" transmitem uma experiência altamente positiva.

    "O salmão grelhado estava perfeitamente cozinhado e cheio de sabor, e os legumes da época eram um ótimo complemento." Sentimento: Explicação positiva: "Cozinhado na perfeição", "cheio de sabor" e "excelente complemento" indicam uma forte satisfação com a comida.

    "A nossa empregada, Maria, foi atenciosa e simpática, e sugeriu a tarte de limão para sobremesa—que estava excelente." Sentimento: Explicação Positiva: Descrições positivas das qualidades do empregado e da sobremesa ("atencioso", "simpático", "excelente") refletem um cliente muito satisfeito.

    "Recomendo absolutamente este sítio para uma noite relaxante e agradável." Sentimento: Explicação Positiva: Uma recomendação clara com as palavras "absolutamente", "relaxado" e "agradável" demonstra um forte sentimento positivo.

  • Sentimento geral do documento: fortemente positivo. A crítica está repleta de linguagem elogiosa sobre a comida, o ambiente, o serviço e a experiência geral. Não há declarações neutras ou negativas.

Quando usar um modelo de IA de uso geral para análise de texto

Para além da extração de frases-chave, reconhecimento de entidades e análise de sentimento, os modelos de IA de uso geral também podem resumir documentos longos em parágrafos concisos, traduzir texto entre línguas, classificar conteúdos em categorias que definir, responder a perguntas sobre uma passagem e muito mais. Como todas estas capacidades são impulsionadas por prompts em linguagem natural, pode combiná-las livremente — por exemplo, pedir ao modelo que traduza uma revisão longa e depois resumi-la numa única conversa.

Utilização da Linguagem Azure nas ferramentas Foundry

Embora um grande modelo de linguagem treinado para cargas gerais de IA generativa possa muitas vezes fazer um excelente trabalho de análise de texto, por vezes uma ferramenta mais especializada obtém resultados mais previsíveis.

Azure Language in Foundry tools é um serviço de processamento de linguagem natural com analisadores concebidos para tarefas específicas de análise de texto. Estes analisadores utilizam técnicas estatísticas para devolver resultados estruturados e determinísticos — tornando-os bem adequados para pipelines automatizados onde resultados consistentes são importantes.

No portal novo Foundry, pode explorar algumas das capacidades da Azure Language no chat playground. Para testar as capacidades dos serviços de IA, navegue até à página Build , depois a Models, e depois ao separador de serviços de IA . No separador, pode encontrar uma seleção de serviços de IA disponíveis para testes.

Captura de ecrã do separador de serviços de IA do portal Foundry.

Considere as seguintes capacidades do Azure Language:

  • A deteção de línguas avalia o texto e deteta a língua e o dialeto.
  • A deteção de informações de identificação pessoal (PII) identifica informações pessoais confidenciais, incluindo informações pessoais de saúde (PHI).

Deteção de idioma

Num fluxo de trabalho multilíngue, o primeiro passo é frequentemente identificar a linguagem em que um documento está escrito, para que o texto possa ser encaminhado para o modelo ou processo mais apropriado. A deteção de linguagem avalia o texto e identifica a língua principal juntamente com uma pontuação de confiança. O Azure Language suporta uma vasta gama de línguas e dialetos regionais.

Por exemplo, dado o seguinte texto:

"¡Hola! Me chamo Josefina y vivo em Madrid, Espanha."

A deteção de linguagem retorna o seguinte resultado:

Linguagem Código ISO 6391 Pontuação de confiança
Espanhol es 1,00

No portal Foundry, pode testar a funcionalidade de deteção de línguas do Azure Language no chat Playground.

Captura de ecrã da capacidade de deteção de línguas do chat playground.

Deteção de informação pessoalmente identificável

As organizações muitas vezes precisam de identificar e redigir detalhes pessoais sensíveis do texto antes de serem armazenados ou partilhados, para cumprir as regulamentações de privacidade. A deteção de informação pessoal identificável (PII) identifica detalhes pessoais em texto — como nomes, números de telefone, endereços de email e endereços de rua — e pode, opcionalmente, censurá-los.

Por exemplo, dado o seguinte texto:

"Maria Garcia ligou pelo 020 7946 0958 e pediu para enviar documentos para 42 Market Road, Londres, Reino Unido, SW1A 1AA."

A deteção de PII identifica as seguintes entidades:

Texto Categoria
Maria Garcia Pessoa
020 7946 0958 Número de telefone
42 Market Road, Londres, Reino Unido, SW1A 1AA Morada

No portal Foundry, pode testar a funcionalidade de deteção de PII do Azure Language no Language Playground.

Captura de ecrã da capacidade de deteção de PII do Language Playground.

De seguida, aprenda como criar uma aplicação cliente com capacidades de análise de texto usando tanto a API de respostas OpenAI como o Azure Language SDK.