Introdução

Concluído

A visão computacional é um campo da IA que permite às máquinas interpretar e compreender informação visual do mundo — como imagens, vídeos e transmissões de câmaras em direto. As capacidades de visão computacional são alimentadas por modelos de IA e suportam a automação de todo o tipo de tarefas que consomem muito tempo.

Este módulo irá discutir modelos de IA capazes de identificar e analisar objetos, reconhecer padrões, ler texto dentro de imagens e interpretar cenas de forma semelhante a um humano. O módulo também aborda modelos de IA visual que podem ir além da análise de imagens para gerar novo conteúdo visual. Em conjunto, estas capacidades permitem uma vasta gama de aplicações, desde pesquisa de imagens e análise de documentos, até ferramentas criativas e experiências interativas de IA, permitindo que os sistemas vejam e criem informação visual.

Considere estas aplicações da visão computacional:

  • Deteção de defeitos na fabricação: Sistemas de visão com IA inspecionam produtos em linhas de montagem em tempo real. Eles detetam defeitos de superfície, desalinhamentos ou componentes ausentes usando deteção de objetos e segmentação de imagem, reduzindo o desperdício e melhorando o controle de qualidade.

  • Análise de imagiologia médica: A visão computacional ajuda os radiologistas a analisar radiografias, ressonâncias magnéticas e tomografias computorizadas. Os modelos de IA podem destacar anomalias como tumores ou fraturas, auxiliar no diagnóstico precoce e reduzir o erro humano.

  • Monitorização de prateleiras no comércio a retalho: Os retalhistas utilizam a visão de IA para monitorizar as prateleiras das lojas. As câmeras detetam quando os produtos estão fora de estoque ou extraviados, permitindo atualizações de inventário em tempo real e melhorando a experiência do cliente.

  • Veículos autónomos: Os carros autónomos dependem da visão computacional para reconhecer sinais de trânsito, marcações de faixa, peões e outros veículos. Isto permite uma navegação segura e a tomada de decisões em ambientes dinâmicos.

De seguida, explore modelos multimodais no Microsoft Foundry, a plataforma unificada como serviço da Microsoft no Azure para operações empresariais de IA e desenvolvimento de aplicações.

Observação

Reconhecemos que pessoas diferentes gostam de aprender de maneiras diferentes. Pode optar por completar este módulo em formato de vídeo ou pode ler o conteúdo como texto e imagens. O texto contém mais detalhes do que os vídeos, portanto, em alguns casos, você pode querer se referir a ele como material complementar à apresentação do vídeo.