Indexers - Create

Skapar en ny indexerare.

POST {endpoint}/indexers?api-version=2026-04-01

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string (uri)

Slutpunkts-URL:en för söktjänsten.

api-version
query True

string

minLength: 1

Den API-version som ska användas för den här åtgärden.

Begärandehuvud

Name Obligatorisk Typ Description
Accept

Accept

Acceptera-rubriken.

x-ms-client-request-id

string (uuid)

En ogenomskinlig, globalt unik, klientgenererad strängidentifierare för begäran.

Begärandetext

Name Obligatorisk Typ Description
dataSourceName True

string

Namnet på den datakälla som indexeraren läser data från.

name True

string

Namnet på indexeraren.

targetIndexName True

string

Namnet på indexet som indexeraren skriver data till.

@odata.etag

string

Indexerarens ETag.

description

string

Beskrivningen av indexeraren.

disabled

boolean

Ett värde som anger om indexeraren är inaktiverad. Standardvärdet är false.

encryptionKey

SearchResourceEncryptionKey

En beskrivning av en krypteringsnyckel som du skapar i Azure Key Vault. Den här nyckeln används för att tillhandahålla ytterligare en nivå av kryptering i vila för indexerardefinitionen (samt indexerarens körningsstatus) när du vill ha fullständig försäkran om att ingen, inte ens Microsoft, kan dekryptera dem. När du har krypterat indexerarens definition förblir den alltid krypterad. Söktjänsten ignorerar försök att ange den här egenskapen till null. Du kan ändra den här egenskapen efter behov om du vill rotera krypteringsnyckeln. Indexerarens definition (och indexerarens körningsstatus) påverkas inte. Kryptering med kundhanterade nycklar är inte tillgängligt för kostnadsfria söktjänster och är endast tillgängligt för betaltjänster som skapats den 1 januari 2019 eller senare.

fieldMappings

FieldMapping[]

Definierar mappningar mellan fält i datakällan och motsvarande målfält i indexet.

outputFieldMappings

FieldMapping[]

Utdatafältmappningar tillämpas efter berikning och omedelbart före indexering.

parameters

IndexingParameters

Parametrar för indexeringskörning.

schedule

IndexingSchedule

Schemat för den här indexeraren.

skillsetName

string

Namnet på kompetensuppsättningen som körs med den här indexeraren.

Svar

Name Typ Description
201 Created

SearchIndexer

Begäran har slutförts och en ny resurs har skapats som ett resultat.

Other Status Codes

ErrorResponse

Ett oväntat felsvar.

Säkerhet

api-key

Typ: apiKey
I: header

OAuth2Auth

Typ: oauth2
Flow: implicit
Auktoriseringswebbadress: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Omfattningar

Name Description
https://search.azure.com/.default

Exempel

SearchServiceCreateIndexer

Exempelbegäran

POST https://exampleservice.search.windows.net/indexers?api-version=2026-04-01


{
  "name": "myindexer",
  "description": "Description of the indexer",
  "dataSourceName": "indexertestdatasource",
  "skillsetName": "myskillset",
  "targetIndexName": "example-index",
  "schedule": {
    "interval": "P1D",
    "startTime": "2025-01-07T19:30:00Z"
  },
  "parameters": {
    "batchSize": 10,
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5,
    "configuration": {
      "parsingMode": "markdown",
      "excludedFileNameExtensions": ".png,.mp4",
      "indexedFileNameExtensions": ".docx,.pptx",
      "failOnUnsupportedContentType": true,
      "failOnUnprocessableDocument": false,
      "indexStorageMetadataOnlyForOversizedDocuments": true,
      "delimitedTextHeaders": "Header1,Header2",
      "delimitedTextDelimiter": "|",
      "firstLineContainsHeaders": true,
      "markdownParsingSubmode": "oneToMany",
      "markdownHeaderDepth": "h6",
      "documentRoot": "/root",
      "dataToExtract": "storageMetadata",
      "imageAction": "none",
      "allowSkillsetToReadFileData": false,
      "pdfTextRotationAlgorithm": "none",
      "executionEnvironment": "standard"
    }
  },
  "fieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "outputFieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "disabled": false,
  "@odata.etag": "0x1234568AE7E58A1"
}

Exempelsvar

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "myindexer",
  "description": "Description of the indexer",
  "dataSourceName": "indexertestdatasource",
  "skillsetName": "myskillset",
  "targetIndexName": "example-index",
  "disabled": false,
  "schedule": {
    "interval": "P1D",
    "startTime": "2024-06-06T00:01:50.265Z"
  },
  "parameters": {
    "batchSize": 10,
    "maxFailedItems": 10,
    "maxFailedItemsPerBatch": 5,
    "configuration": {
      "parsingMode": "markdown",
      "excludedFileNameExtensions": ".png,.mp4",
      "indexedFileNameExtensions": ".docx,.pptx",
      "failOnUnsupportedContentType": true,
      "failOnUnprocessableDocument": false,
      "indexStorageMetadataOnlyForOversizedDocuments": true,
      "delimitedTextHeaders": "Header1,Header2",
      "delimitedTextDelimiter": "|",
      "firstLineContainsHeaders": true,
      "markdownParsingSubmode": "oneToMany",
      "markdownHeaderDepth": "h6",
      "documentRoot": "/root",
      "dataToExtract": "storageMetadata",
      "imageAction": "none",
      "allowSkillsetToReadFileData": false,
      "pdfTextRotationAlgorithm": "none",
      "executionEnvironment": "standard"
    }
  },
  "fieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ],
  "outputFieldMappings": [
    {
      "sourceFieldName": "/document",
      "targetFieldName": "name",
      "mappingFunction": {
        "name": "base64Encode"
      }
    }
  ]
}

Definitioner

Name Description
Accept

Acceptera-rubriken.

BlobIndexerDataToExtract

Anger de data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "none". Detta gäller för inbäddat bildinnehåll i en .PDF eller ett annat program, eller bildfiler som .jpg och .png, i Azure-blobar.

BlobIndexerImageAction

Avgör hur inbäddade bilder och bildfiler ska bearbetas i Azure Blob Storage. Om du ställer in konfigurationen "imageAction" på något annat värde än "none" krävs att en kompetensuppsättning också kopplas till indexeraren.

BlobIndexerParsingMode

Representerar parsningsläget för indexering från en Azure Blob Data-källa.

BlobIndexerPDFTextRotationAlgorithm

Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

ErrorDetail

Felinformationen.

ErrorResponse

Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.).

FieldMapping

Definierar en mappning mellan ett fält i en datakälla och ett målfält i ett index.

FieldMappingFunction

Representerar en funktion som omvandlar ett värde från en datakälla före indexering.

IndexerExecutionEnvironment

Anger den miljö där indexeraren ska köras.

IndexingParameters

Representerar parametrar för indexeringskörning.

IndexingParametersConfiguration

En ordlista med indexerarspecifika konfigurationsegenskaper. Varje namn är namnet på en specifik egenskap. Varje värde måste vara av en primitiv typ.

IndexingSchedule

Representerar ett schema för indexeringskörning.

SearchIndexer

Representerar en indexerare.

SearchIndexerDataNoneIdentity

Rensar identitetsegenskapen för en datakälla.

SearchIndexerDataUserAssignedIdentity

Anger identiteten för en datakälla som ska användas.

SearchResourceEncryptionKey

En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar.

Accept

Acceptera-rubriken.

Värde Description
application/json;odata.metadata=minimal

BlobIndexerDataToExtract

Anger de data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "none". Detta gäller för inbäddat bildinnehåll i en .PDF eller ett annat program, eller bildfiler som .jpg och .png, i Azure-blobar.

Värde Description
storageMetadata

Indexerar bara standardblobegenskaperna och användardefinierade metadata.

allMetadata

Extraherar metadata som tillhandahålls av Azure Blob Storage-undersystemet och innehållstypspecifika metadata (till exempel metadata som är unika för bara .png filer indexeras).

contentAndMetadata

Extraherar alla metadata och textinnehåll från varje blob.

BlobIndexerImageAction

Avgör hur inbäddade bilder och bildfiler ska bearbetas i Azure Blob Storage. Om du ställer in konfigurationen "imageAction" på något annat värde än "none" krävs att en kompetensuppsättning också kopplas till indexeraren.

Värde Description
none

Ignorerar inbäddade bilder eller bildfiler i datauppsättningen. Det här är standardinställningen.

generateNormalizedImages

Extraherar text från bilder (till exempel ordet "STOP" från en trafikstoppsskylt) och bäddar in den i innehållsfältet. Den här åtgärden kräver att "dataToExtract" är inställt på "contentAndMetadata". En normaliserad bild refererar till ytterligare bearbetning som resulterar i enhetlig bildutdata, storlek och roterad för att främja konsekvent återgivning när du inkluderar bilder i visuella sökresultat. Den här informationen genereras för varje bild när du använder det här alternativet.

generateNormalizedImagePerPage

Extraherar text från bilder (till exempel ordet "STOP" från en trafikstoppsskylt) och bäddar in den i innehållsfältet, men behandlar PDF-filer på olika sätt på så sätt att varje sida återges som en bild och normaliseras därefter, i stället för att extrahera inbäddade bilder. Filtyper som inte är PDF-filer behandlas på samma sätt som om "generateNormalizedImages" angavs.

BlobIndexerParsingMode

Representerar parsningsläget för indexering från en Azure Blob Data-källa.

Värde Description
default

Ange som standard för normal filbearbetning.

text

Ange till text för att förbättra indexeringsprestanda för oformaterade textfiler i Blob Storage.

delimitedText

Ange till avgränsadtext när blobar är vanliga CSV-filer.

json

Ange till json för att extrahera strukturerat innehåll från JSON-filer.

jsonArray

Ange till jsonArray för att extrahera enskilda element i en JSON-matris som separata dokument.

jsonLines

Ange till jsonLines för att extrahera enskilda JSON-entiteter, avgränsade med en ny rad, som separata dokument.

markdown

Ställ in på markdown för att extrahera innehåll från markdown-filer.

BlobIndexerPDFTextRotationAlgorithm

Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.

Värde Description
none

Utnyttjar normal textextrahering. Det här är standardinställningen.

detectAngles

Kan ge bättre och mer läsbar textextrahering från PDF-filer som har roterat text i dem. Observera att det kan uppstå en liten inverkan på prestandahastigheten när den här parametern används. Den här parametern gäller endast PDF-filer och endast pdf-filer med inbäddad text. Om den roterade texten visas i en inbäddad bild i PDF-filen gäller inte den här parametern.

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

Name Typ Description
info

Den ytterligare informationen.

type

string

Typen av ytterligare information.

ErrorDetail

Felinformationen.

Name Typ Description
additionalInfo

ErrorAdditionalInfo[]

Felet ytterligare information.

code

string

Felkoden.

details

ErrorDetail[]

Felinformationen.

message

string

Felmeddelandet.

target

string

Felmålet.

ErrorResponse

Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.).

Name Typ Description
error

ErrorDetail

Felet objektet.

FieldMapping

Definierar en mappning mellan ett fält i en datakälla och ett målfält i ett index.

Name Typ Description
mappingFunction

FieldMappingFunction

En funktion som ska tillämpas på varje källfältsvärde före indexering.

sourceFieldName

string

Namnet på fältet i datakällan.

targetFieldName

string

Namnet på målfältet i indexet. Samma som källfältets namn som standard.

FieldMappingFunction

Representerar en funktion som omvandlar ett värde från en datakälla före indexering.

Name Typ Description
name

string

Namnet på fältmappningsfunktionen.

parameters

En ordlista med parameternamn/värde-par som ska skickas till funktionen. Varje värde måste vara av en primitiv typ.

IndexerExecutionEnvironment

Anger den miljö där indexeraren ska köras.

Värde Description
standard

Anger att söktjänsten kan avgöra var indexeraren ska köras. Det här är standardmiljön när inget har angetts och är det rekommenderade värdet.

private

Anger att indexeraren ska köras med den miljö som är etablerad specifikt för söktjänsten. Detta bör endast anges som körningsmiljö om indexeraren behöver komma åt resurser på ett säkert sätt via delade privata länkresurser.

IndexingParameters

Representerar parametrar för indexeringskörning.

Name Typ Standardvärde Description
batchSize

integer (int32)

Antalet objekt som läses från datakällan och indexeras som en enda batch för att förbättra prestandan. Standardvärdet beror på typen av datakälla.

configuration

IndexingParametersConfiguration

En ordlista med indexerarspecifika konfigurationsegenskaper. Varje namn är namnet på en specifik egenskap. Varje värde måste vara av en primitiv typ.

maxFailedItems

integer (int32)

0

Det maximala antalet objekt som kan misslyckas med indexeringen för att indexerarkörningen fortfarande ska anses vara lyckad. -1 betyder ingen gräns. Standardvärdet är 0.

maxFailedItemsPerBatch

integer (int32)

0

Det maximala antalet objekt i en enskild batch som kan misslyckas med indexeringen för att batchen fortfarande ska anses vara lyckad. -1 betyder ingen gräns. Standardvärdet är 0.

IndexingParametersConfiguration

En ordlista med indexerarspecifika konfigurationsegenskaper. Varje namn är namnet på en specifik egenskap. Varje värde måste vara av en primitiv typ.

Name Typ Standardvärde Description
allowSkillsetToReadFileData

boolean

False

Om det är sant skapar du en sökväg //document///file_data som är ett objekt som representerar de ursprungliga fildata som laddats ned från blobdatakällan. På så sätt kan du skicka ursprungliga fildata till en anpassad färdighet för bearbetning i berikningspipelinen, eller till skickligheten för dokumentextrahering.

dataToExtract

BlobIndexerDataToExtract

contentAndMetadata

Anger de data som ska extraheras från Azure Blob Storage och talar om för indexeraren vilka data som ska extraheras från bildinnehåll när "imageAction" är inställt på ett annat värde än "none". Detta gäller för inbäddat bildinnehåll i en .PDF eller ett annat program, eller bildfiler som .jpg och .png, i Azure-blobar.

delimitedTextDelimiter

string

För CSV-blobar anger du avgränsare för enskilda tecken i slutet av rad för CSV-filer där varje rad startar ett nytt dokument (till exempel |").

delimitedTextHeaders

string

För CSV-blobar anger en kommaavgränsad lista med kolumnrubriker, som är användbar för att mappa källfält till målfält i ett index.

documentRoot

string

För JSON-matriser, med ett strukturerat eller halvstrukturerat dokument, kan du ange en sökväg till matrisen med hjälp av den här egenskapen.

excludedFileNameExtensions

string

Kommaavgränsad lista över filnamnstillägg som ska ignoreras vid bearbetning från Azure Blob Storage. Du kan till exempel exkludera ".png, .mp4" för att hoppa över dessa filer under indexeringen.

executionEnvironment

IndexerExecutionEnvironment

standard

Anger den miljö där indexeraren ska köras.

failOnUnprocessableDocument

boolean

False

För Azure-blobar anger du till false om du vill fortsätta indexeringen om ett dokument inte indexerar.

failOnUnsupportedContentType

boolean

False

För Azure-blobbar anger du till false om du vill fortsätta indexeringen när en innehållstyp som inte stöds påträffas och du inte känner till alla innehållstyper (filtillägg) i förväg.

firstLineContainsHeaders

boolean

True

För CSV-blobar anger att den första raden (icke-tom) för varje blob innehåller rubriker.

imageAction

BlobIndexerImageAction

none

Avgör hur inbäddade bilder och bildfiler ska bearbetas i Azure Blob Storage. Om du ställer in konfigurationen "imageAction" på något annat värde än "none" krävs att en kompetensuppsättning också kopplas till indexeraren.

indexStorageMetadataOnlyForOversizedDocuments

boolean

False

För Azure-blobar anger du den här egenskapen till true för att fortfarande indexeras lagringsmetadata för blobinnehåll som är för stort för att bearbetas. Överdimensionerade blobbar hanteras som fel per standard. Begränsningar för blobstorlek finns i https://dotnet.territoriali.olinfo.it/azure/search/search-limits-quotas-capacity.

indexedFileNameExtensions

string

Kommaavgränsad lista över filnamnstillägg som ska väljas vid bearbetning från Azure Blob Storage. Du kan till exempel fokusera indexering på specifika programfiler ".docx, .pptx, .msg" för att specifikt inkludera dessa filtyper.

markdownHeaderDepth enum:
  • h1
  • h2
  • h3
  • h4
  • h5
  • h6
h6

Anger det maximala rubrikdjup som ska beaktas vid gruppering av markdown-innehåll. Standard är h6.

markdownParsingSubmode enum:
  • oneToMany
  • oneToOne
oneToMany

Anger det underläge som avgör om en markdown-fil ska parsas till exakt ett sökdokument eller flera sökdokument. Standard är oneToMany.

parsingMode

BlobIndexerParsingMode

default

Representerar parsningsläget för indexering från en Azure Blob Data-källa.

pdfTextRotationAlgorithm

BlobIndexerPDFTextRotationAlgorithm

none

Avgör algoritmen för textextrahering från PDF-filer i Azure Blob Storage.

queryTimeout

string

00:05:00

Ökar tidsgränsen utöver standardvärdet på 5 minuter för Azure SQL-databasdatakällor, som anges i formatet "hh:mm:ss".

IndexingSchedule

Representerar ett schema för indexeringskörning.

Name Typ Description
interval

string (duration)

Tidsintervallet mellan indexerarkörningar.

startTime

string (date-time)

Den tid då en indexerare ska börja köras.

SearchIndexer

Representerar en indexerare.

Name Typ Standardvärde Description
@odata.etag

string

Indexerarens ETag.

dataSourceName

string

Namnet på den datakälla som indexeraren läser data från.

description

string

Beskrivningen av indexeraren.

disabled

boolean

False

Ett värde som anger om indexeraren är inaktiverad. Standardvärdet är false.

encryptionKey

SearchResourceEncryptionKey

En beskrivning av en krypteringsnyckel som du skapar i Azure Key Vault. Den här nyckeln används för att tillhandahålla ytterligare en nivå av kryptering i vila för indexerardefinitionen (samt indexerarens körningsstatus) när du vill ha fullständig försäkran om att ingen, inte ens Microsoft, kan dekryptera dem. När du har krypterat indexerarens definition förblir den alltid krypterad. Söktjänsten ignorerar försök att ange den här egenskapen till null. Du kan ändra den här egenskapen efter behov om du vill rotera krypteringsnyckeln. Indexerarens definition (och indexerarens körningsstatus) påverkas inte. Kryptering med kundhanterade nycklar är inte tillgängligt för kostnadsfria söktjänster och är endast tillgängligt för betaltjänster som skapats den 1 januari 2019 eller senare.

fieldMappings

FieldMapping[]

Definierar mappningar mellan fält i datakällan och motsvarande målfält i indexet.

name

string

Namnet på indexeraren.

outputFieldMappings

FieldMapping[]

Utdatafältmappningar tillämpas efter berikning och omedelbart före indexering.

parameters

IndexingParameters

Parametrar för indexeringskörning.

schedule

IndexingSchedule

Schemat för den här indexeraren.

skillsetName

string

Namnet på kompetensuppsättningen som körs med den här indexeraren.

targetIndexName

string

Namnet på indexet som indexeraren skriver data till.

SearchIndexerDataNoneIdentity

Rensar identitetsegenskapen för en datakälla.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Ett URI-fragment som anger typen av identitet.

SearchIndexerDataUserAssignedIdentity

Anger identiteten för en datakälla som ska användas.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Ett URI-fragment som anger typen av identitet.

userAssignedIdentity

string

Det fullständigt kvalificerade Azure-resurs-ID:t för en användartilldelad hanterad identitet, vanligtvis i formuläret "/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" som borde ha tilldelats söktjänsten.

SearchResourceEncryptionKey

En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar.

Name Typ Description
accessCredentials.applicationId

string

Ett AAD-program-ID som har beviljats nödvändiga åtkomstbehörigheter till Azure Key Vault som ska användas när du krypterar dina data i vila. Program-ID:t bör inte förväxlas med objekt-ID:t för ditt AAD-program.

accessCredentials.applicationSecret

string

Autentiseringsnyckeln för det angivna AAD-programmet.

identity SearchIndexerDataIdentity:

En explicit hanterad identitet som ska användas för den här krypteringsnyckeln. Om det inte anges och egenskapen för åtkomstautentiseringsuppgifter är null används den systemtilldelade hanterade identiteten. Om den explicita identiteten är ospecificerad vid uppdatering av resursen förblir den oförändrad. Om "ingen" anges rensas värdet för den här egenskapen.

keyVaultKeyName

string

Namnet på din Azure Key Vault-nyckel som ska användas för att kryptera dina vilande data.

keyVaultKeyVersion

string

Den version av Azure Key Vault-nyckeln som ska användas för att kryptera dina vilande data.

keyVaultUri

string

URI:n för ditt Azure Key Vault, även kallat DNS-namn, som innehåller nyckeln som ska användas för att kryptera dina data i vila. Ett exempel på en URI kan vara https://my-keyvault-name.vault.azure.net.