Criar uma fonte de conhecimento OneLake indexada

Nota

Esta funcionalidade de recuperação pelo agente está geralmente disponível a partir de 01-04-2026 na versão da API REST via acesso programático. Os portais Azure e Microsoft Foundry continuam a fornecer acesso exclusivamente em pré-visualização a todas as funcionalidades de recuperação de dados através de agentes. Para orientações sobre migração, consulte Migrar código de recuperação agential para a versão mais recente.

Utilizar uma fonte de conhecimento OneLake indexada para indexar e consultar ficheiros Microsoft OneLake num pipeline de recuperação agêntica. As fontes de conhecimento são criadas de forma independente, referenciadas numa base de conhecimento e usadas como dados de base quando um agente ou chatbot chama uma ação de recuperação no momento da consulta.

Quando cria uma fonte de conhecimento OneLake indexada, especifica uma fonte de dados externa, modelos e propriedades para gerar automaticamente os seguintes objetos Pesquisa de IA do Azure:

Uma fonte de dados que representa uma casa de lago.
Um conjunto de competências que segmenta e vetoriza opcionalmente conteúdos multimodais da lakehouse.
Um índice que armazena conteúdo enriquecido e cumpre os critérios para a recuperação agêntica.
Um indexador que utiliza os objetos anteriores para gerir o pipeline de indexação e enriquecimento.

O indexador gerado conforma-se com o indexador OneLake, cujos pré-requisitos, tarefas suportadas, formatos de documentos suportados, atalhos suportados e limitações também se aplicam às fontes de conhecimento OneLake. Para mais informações, consulte a documentação do indexador OneLake.

Suporte de utilização

Portal do Azure	Portal Microsoft Foundry	.NET SDK	Python SDK	Java SDK	JavaScript SDK	REST API
✔️	✔️	✔️	✔️	✔️	✔️	✔️

Pré-requisitos

Pesquisa de IA do Azure em qualquer região que forneça recuperação agentica.
Conclusão dos pré-requisitos do indexador OneLake.
Conclusão da preparação dos dados do indexador OneLake.
Permissão para criar e usar objetos no Pesquisa de IA do Azure. Recomendamos acesso baseado em funções, mas pode usar chaves API se a atribuição de funções não for viável. Para mais informações, consulte Ligar-se a um serviço de pesquisa.

Obrigatório pacote Azure.Search.Documents:
- Para as funcionalidades de pré-visualização de 2025-11-01, o pacote de pré-visualização mais recente: dotnet add package Azure.Search.Documents --prerelease
- Para as funcionalidades de 01/04/2026, o pacote estável mais recente: dotnet add package Azure.Search.Documents

Pacote azure-search-documents obrigatório:
- Para as funcionalidades de pré-visualização de 2025-11-01, o pacote de pré-visualização mais recente: pip install azure-search-documents --pre
- Para as funcionalidades de 01/04/2026, o pacote estável mais recente: pip install azure-search-documents

Versão obrigatória da API REST:
- Para funcionalidades de pré-visualização: Serviço de Pesquisa 2025-11-01-preview
- Para funcionalidades geralmente disponíveis: Serviço de Pesquisa 2026-04-01

Verifique fontes de conhecimento existentes

Uma fonte de conhecimento é um objeto de topo e reutilizável. Conhecer as fontes de conhecimento existentes é útil tanto para reutilizar como para nomear novos objetos.

Execute o seguinte código para listar as fontes de conhecimento por nome e tipo.

// List knowledge sources by name and type
using Azure.Search.Documents.Indexes;

var indexClient = new SearchIndexClient(new Uri(searchEndpoint), credential);
var knowledgeSources = indexClient.GetKnowledgeSourcesAsync();

Console.WriteLine("Knowledge Sources:");

await foreach (var ks in knowledgeSources)
{
    Console.WriteLine($"  Name: {ks.Name}, Type: {ks.GetType().Name}");
}

Nome	Descrição	Tipo	Editável	Obrigatório
`Name`	O nome da fonte de conhecimento, que deve ser único dentro da coleção de fontes de conhecimento e seguir as diretrizes nomeação para objetos em Pesquisa de IA do Azure.	Corda	Não	Sim
`Description`	Uma descrição da fonte de conhecimento.	Corda	Sim	Não
`EncryptionKey`	Uma chave gerida pelo cliente para encriptar informação sensível tanto na fonte de conhecimento como nos objetos gerados.	Objetivo	Sim	Não
`IndexedOneLakeKnowledgeSourceParameters`	Parâmetros específicos para fontes de conhecimento OneLake: `FabricWorkspaceId`, `LakehouseId`, e `TargetPath`.	Objetivo		Sim
`FabricWorkspaceId`	O Identificador Global Único (GUID) do espaço de trabalho que contém o Lakehouse.	Corda	Não	Sim
`LakehouseId`	O GUID da casa do lago.	Corda	Não	Sim
`TargetPath`	Uma pasta ou atalho dentro do lakehouse. Quando não especificado, toda a casa do lago é indexada.	Corda	Não	Não

Nome	Descrição	Tipo	Editável	Obrigatório
`Identity`	Uma identidade gerida para usar no indexador gerado.	Objetivo	Sim	Não
`DisableImageVerbalization`	Permite ou desativa o uso da verbalização de imagens. O padrão é `False`, que permite a verbalização da imagem. Defina para `True` para desativar a verbalização de imagens.	booleano	Não	Não
`ChatCompletionModel`	Um modelo de conclusão de chat que verbaliza imagens ou extrai conteúdo. Os modelos suportados são `gpt-4o`, `gpt-4o-mini`, `gpt-4.1`, `gpt-4.1-mini`, `gpt-4.1-nano`, `gpt-5`, `gpt-5-mini`, e `gpt-5-nano`. A competência GenAI Prompt está incluída no conjunto de competências gerado. Definir este parâmetro também requer que seja `DisableImageVerbalization` definido como `False`.	Objetivo	Apenas `ApiKey` e `DeploymentName` são editáveis	Não
`EmbeddingModel`	Um modelo de incorporação de texto que vetoriza o texto e o conteúdo de imagens durante a indexação e no momento da consulta. Os modelos suportados são `text-embedding-ada-002`, `text-embedding-3-small`, e `text-embedding-3-large`. A competência Azure OpenAI Embedding está incluída no conjunto de competências geradas, e o vetorizador OpenAI Azure está incluído no índice gerado.	Objetivo	Apenas `ApiKey` e `DeploymentName` são editáveis	Não
`ContentExtractionMode`	Controla como o conteúdo é extraído dos ficheiros. O padrão é `minimal`, que utiliza extração padrão de conteúdo para texto e imagens. Definido para `standard` para quebrar e fragmentar documentos avançados usando a funcionalidade Azure Content Understanding, que está incluído no conjunto de funcionalidades gerado. Para `standard` apenas, o `AiServices` parâmetro é especificável.	Corda	Não	Não
`AiServices`	Um recurso da Microsoft Foundry para aceder ao Azure Content Understanding no Foundry Tools. Definir este parâmetro requer que `ContentExtractionMode` seja definido como `standard`.	Objetivo	Só `ApiKey` é editável	Não
`IngestionSchedule`	Adiciona informação de agendamento ao indexador gerado. Também pode adicionar um horário mais tarde para automatizar a atualização dos dados.	Objetivo	Sim	Não
`IngestionPermissionOptions`	As permissões ao nível do documento para integrar junto com o conteúdo. Especifique `UserIds`, `GroupIds` ou `RbacScope` para armazenar metadados de permissão no índice. Para orientações específicas por código-fonte, veja Ingerir permissões RBAC a partir do armazenamento de blob e Ingerir ACLs a partir da ADLS Gen2. Para fazer cumprir estas permissões no momento da consulta, veja Impor permissões no momento da consulta.	Array	Não	Não

Criar uma fonte de conhecimento OneLake indexada

Suporte de utilização

Pré-requisitos

Verifique fontes de conhecimento existentes

Criar uma fonte de conhecimento

Propriedades específicas da fonte

Propriedades dos parâmetros de ingestão

Verificar o estado da ingestão

Revise os objetos criados

Atribuir a uma base de conhecimento

Eliminar uma fonte de conhecimento

Conteúdo relacionado

Comentários

Recursos adicionais