Indexes - Get

Hämtar en indexdefinition.

GET {endpoint}/indexes('{indexName}')?api-version=2026-04-01

URI-parametrar

Name I Obligatorisk Typ Description
endpoint
path True

string (uri)

Slutpunkts-URL:en för söktjänsten.

indexName
path True

string

Namnet på indexet.

api-version
query True

string

minLength: 1

Den API-version som ska användas för den här åtgärden.

Begärandehuvud

Name Obligatorisk Typ Description
Accept

Accept

Acceptera-rubriken.

x-ms-client-request-id

string (uuid)

En ogenomskinlig, globalt unik, klientgenererad strängidentifierare för begäran.

Svar

Name Typ Description
200 OK

SearchIndex

Begäran har slutförts.

Other Status Codes

ErrorResponse

Ett oväntat felsvar.

Säkerhet

api-key

Typ: apiKey
I: header

OAuth2Auth

Typ: oauth2
Flow: implicit
Auktoriseringswebbadress: https://login.microsoftonline.com/common/oauth2/v2.0/authorize

Omfattningar

Name Description
https://search.azure.com/.default

Exempel

SearchServiceGetIndex

Exempelbegäran

GET https://exampleservice.search.windows.net/indexes('example-index')?api-version=2026-04-01

Exempelsvar

{
  "@odata.etag": "0x1234568AE7E58A1",
  "name": "example-index",
  "description": "description",
  "defaultScoringProfile": "stringFieldBoost",
  "fields": [
    {
      "name": "id",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": true,
      "synonymMaps": []
    },
    {
      "name": "vector1",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 20,
      "vectorSearchProfile": "config1",
      "synonymMaps": []
    },
    {
      "name": "vector1b",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector2",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector3",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 5,
      "vectorSearchProfile": "config3",
      "synonymMaps": []
    },
    {
      "name": "vector22",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 10,
      "vectorSearchProfile": "config2",
      "synonymMaps": []
    },
    {
      "name": "vector4",
      "type": "Collection(Edm.Single)",
      "searchable": true,
      "filterable": false,
      "retrievable": true,
      "stored": true,
      "sortable": false,
      "facetable": false,
      "key": false,
      "dimensions": 32,
      "vectorSearchProfile": "config4",
      "synonymMaps": []
    },
    {
      "name": "name",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "description",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "standard.lucene",
      "synonymMaps": []
    },
    {
      "name": "category",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "ownerId",
      "type": "Edm.String",
      "searchable": true,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "analyzer": "en.lucene",
      "synonymMaps": []
    },
    {
      "name": "price",
      "type": "Edm.Double",
      "searchable": false,
      "filterable": true,
      "retrievable": true,
      "stored": true,
      "sortable": true,
      "facetable": true,
      "key": false,
      "synonymMaps": []
    }
  ],
  "scoringProfiles": [
    {
      "name": "stringFieldBoost",
      "functionAggregation": "sum",
      "text": {
        "weights": {
          "name": 3,
          "description": 1,
          "category": 2,
          "ownerId": 1
        }
      },
      "functions": [
        {
          "fieldName": "category",
          "interpolation": "linear",
          "type": "tag",
          "boost": 2,
          "tag": {
            "tagsParameter": "categoryTag"
          }
        }
      ]
    }
  ],
  "corsOptions": {
    "allowedOrigins": [
      "https://www.example.com/foo"
    ],
    "maxAgeInSeconds": 10
  },
  "suggesters": [
    {
      "name": "sg",
      "searchMode": "analyzingInfixMatching",
      "sourceFields": [
        "category",
        "ownerId"
      ]
    }
  ],
  "analyzers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomAnalyzer",
      "name": "tagsAnalyzer",
      "tokenizer": "standard_v2",
      "tokenFilters": [
        "common_grams"
      ],
      "charFilters": [
        "html_strip"
      ]
    }
  ],
  "normalizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.CustomNormalizer",
      "name": "my_normalizer",
      "tokenFilters": [
        "my_tokenFilter"
      ],
      "charFilters": [
        "my_mapping"
      ]
    }
  ],
  "tokenizers": [
    {
      "@odata.type": "#Microsoft.Azure.Search.StandardTokenizerV2",
      "name": "my_tokenizer",
      "maxTokenLength": 100
    }
  ],
  "tokenFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.AsciiFoldingTokenFilter",
      "name": "my_tokenFilter",
      "preserveOriginal": false
    }
  ],
  "charFilters": [
    {
      "@odata.type": "#Microsoft.Azure.Search.MappingCharFilter",
      "name": "my_mapping",
      "mappings": [
        ".=>,",
        "_=>-"
      ]
    }
  ],
  "similarity": {
    "@odata.type": "#Microsoft.Azure.Search.BM25Similarity",
    "k1": 10,
    "b": 0.1
  },
  "semantic": {
    "defaultConfiguration": "testconfig",
    "configurations": [
      {
        "name": "testconfig",
        "rankingOrder": "BoostedRerankerScore",
        "prioritizedFields": {
          "titleField": {
            "fieldName": "category"
          },
          "prioritizedContentFields": [
            {
              "fieldName": "description"
            }
          ],
          "prioritizedKeywordsFields": [
            {
              "fieldName": "ownerId"
            }
          ]
        }
      }
    ]
  },
  "vectorSearch": {
    "algorithms": [
      {
        "name": "cosine",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "cosine",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "euclidean",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "euclidean",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      },
      {
        "name": "dotProduct",
        "kind": "hnsw",
        "hnswParameters": {
          "metric": "dotProduct",
          "m": 4,
          "efConstruction": 400,
          "efSearch": 500
        }
      }
    ],
    "profiles": [
      {
        "name": "config1",
        "algorithm": "cosine",
        "vectorizer": "openai",
        "compression": "mySQ8"
      },
      {
        "name": "config2",
        "algorithm": "euclidean",
        "vectorizer": "custom-web-api",
        "compression": "mySQ8"
      },
      {
        "name": "config3",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQC"
      },
      {
        "name": "config4",
        "algorithm": "dotProduct",
        "vectorizer": "custom-web-api",
        "compression": "myBQWithoutOriginals"
      }
    ],
    "vectorizers": [
      {
        "name": "openai",
        "kind": "azureOpenAI",
        "azureOpenAIParameters": {
          "resourceUri": "https://test-sample.openai.azure.com",
          "deploymentId": "model",
          "apiKey": "<redacted>",
          "modelName": "text-embedding-3-large"
        }
      },
      {
        "name": "custom-web-api",
        "kind": "customWebApi",
        "customWebApiParameters": {
          "httpMethod": "POST",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "authResourceId": "api://f89d1c93-58a7-4b07-9a5b-5f89048b927b",
          "httpHeaders": {
            "header1": "value1",
            "header2": "value2"
          },
          "authIdentity": {
            "@odata.type": "#Microsoft.Azure.Search.DataNoneIdentity"
          }
        }
      },
      {
        "name": "aml",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32"
        }
      },
      {
        "name": "aml-cohere",
        "kind": "aml",
        "amlParameters": {
          "resourceId": "aml resource id",
          "region": "aml region",
          "uri": "https://my-custom-endpoint.org/",
          "timeout": "PT1M",
          "modelName": "Cohere-embed-v4"
        }
      }
    ],
    "compressions": [
      {
        "name": "mySQ8",
        "kind": "scalarQuantization",
        "truncationDimension": 2,
        "scalarQuantizationParameters": {
          "quantizedDataType": "int8"
        },
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQC",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "preserveOriginals"
        }
      },
      {
        "name": "myBQWithoutOriginals",
        "kind": "binaryQuantization",
        "truncationDimension": 2,
        "rescoringOptions": {
          "enableRescoring": true,
          "defaultOversampling": 10,
          "rescoreStorageMethod": "discardOriginals"
        }
      }
    ]
  }
}

Definitioner

Name Description
Accept

Acceptera-rubriken.

AIFoundryModelCatalogName

Namnet på den inbäddningsmodell som kommer att kallas från Azure AI Foundry Catalog.

AMLParameters

Anger egenskaperna för att ansluta till en AML-vektoriserare.

AMLVectorizer

Specificerar en Azure Machine Learning-endpoint som distribueras via Azure AI Foundry Model Catalog för att generera vektorinbäddning av en frågesträng.

AsciiFoldingTokenFilter

Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Det här tokenfiltret implementeras med Apache Lucene.

AzureOpenAIModelName

Namnet på Azure Open AI-modellen som ska anropas.

AzureOpenAIVectorizer

Anger den Azure OpenAI-resurs som används för att vektorisera en frågesträng.

AzureOpenAIVectorizerParameters

Anger parametrarna för att ansluta till Azure OpenAI-resursen.

BinaryQuantizationCompression

Innehåller konfigurationsalternativ som är specifika för den binära kvantiseringskomprimeringsmetod som används vid indexering och frågor.

BM25SimilarityAlgorithm

Rankningsfunktion baserat på Okapi BM25-likhetsalgoritmen. BM25 är en TF-IDF-liknande algoritm som innehåller längdnormalisering (styrs av parametern "b" samt termfrekvensmättnad (styrs av parametern k1).

CharFilterName

Definierar namnen på alla teckenfilter som stöds av sökmotorn.

CjkBigramTokenFilter

Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Det här tokenfiltret implementeras med Apache Lucene.

CjkBigramTokenFilterScripts

Skript som kan ignoreras av CjkBigramTokenFilter.

ClassicSimilarityAlgorithm

Äldre likhetsalgoritm som använder Lucene TFIDFSimilarity-implementeringen av TF-IDF. Den här varianten av TF-IDF introducerar normalisering av statisk dokumentlängd samt koordineringsfaktorer som straffar dokument som endast delvis matchar de sökta frågorna.

ClassicTokenizer

Grammatikbaserad tokenizer som är lämplig för bearbetning av de flesta europeiska dokument. Den här tokenizern implementeras med Apache Lucene.

CommonGramTokenFilter

Skapa bigrams för ofta förekommande termer vid indexering. Enkla termer indexeras också, med bigrams överlagrade. Det här tokenfiltret implementeras med Apache Lucene.

CorsOptions

Definierar alternativ för att styra resursdelning mellan ursprung (CORS) för ett index.

CustomAnalyzer

Gör att du kan ta kontroll över processen att konvertera text till indexerbara/sökbara token. Det är en användardefinierad konfiguration som består av en enda fördefinierad tokenizer och ett eller flera filter. Tokenizern ansvarar för att dela upp text i token och filter för att ändra token som genereras av tokenizern.

CustomNormalizer

Gör att du kan konfigurera normalisering för filterbara, sorterbara och fasettbara fält, som som standard fungerar med strikt matchning. Det här är en användardefinierad konfiguration som består av minst ett eller flera filter som ändrar den token som lagras.

DictionaryDecompounderTokenFilter

Sönderdelar sammansatta ord som finns i många germanska språk. Det här tokenfiltret implementeras med Apache Lucene.

DistanceScoringFunction

Definierar en funktion som ökar poängen baserat på avståndet från en geografisk plats.

DistanceScoringParameters

Ger parametervärden till en funktion för avståndsbedömning.

EdgeNGramTokenFilter

Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.

EdgeNGramTokenFilterSide

Anger vilken sida av indata ett n-gram ska genereras från.

EdgeNGramTokenFilterV2

Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.

EdgeNGramTokenizer

Tokeniserar indata från en kant till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.

ElisionTokenFilter

Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Det här tokenfiltret implementeras med Apache Lucene.

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

ErrorDetail

Felinformationen.

ErrorResponse

Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.).

ExhaustiveKnnAlgorithmConfiguration

Innehåller konfigurationsalternativ som är specifika för den fullständiga KNN-algoritmen som används vid frågor, som utför brute-force-sökning i hela vektorindexet.

ExhaustiveKnnParameters

Innehåller parametrarna som är specifika för en fullständig KNN-algoritm.

FreshnessScoringFunction

Definierar en funktion som ökar poängen baserat på värdet för ett datum-tid-fält.

FreshnessScoringParameters

Ger parametervärden till en funktion för färskhetsbedömning.

HnswAlgorithmConfiguration

Innehåller konfigurationsalternativ som är specifika för algoritmen HNSW för ungefärliga närmaste grannar som används vid indexering och frågor. HNSW-algoritmen erbjuder en justerbar avvägning mellan sökhastighet och noggrannhet.

HnswParameters

Innehåller de parametrar som är specifika för HNSW-algoritmen.

KeepTokenFilter

Ett tokenfilter som bara behåller token med text i en angiven lista med ord. Det här tokenfiltret implementeras med Apache Lucene.

KeywordMarkerTokenFilter

Markerar termer som nyckelord. Det här tokenfiltret implementeras med Apache Lucene.

KeywordTokenizer

Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.

KeywordTokenizerV2

Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.

LengthTokenFilter

Tar bort ord som är för långa eller för korta. Det här tokenfiltret implementeras med Apache Lucene.

LexicalAnalyzerName

Definierar namnen på alla textanalysverktyg som stöds av sökmotorn.

LexicalNormalizerName

Definierar namnen på alla textnormaliserare som stöds av sökmotorn.

LexicalTokenizerName

Definierar namnen på alla tokeniserare som stöds av sökmotorn.

LimitTokenFilter

Begränsar antalet token vid indexering. Det här tokenfiltret implementeras med Apache Lucene.

LuceneStandardAnalyzer

Apache Lucene-analysverktyg av standardstandard; Består av standardtokeniseraren, gemener och stoppfilter.

LuceneStandardTokenizer

Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.

LuceneStandardTokenizerV2

Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.

MagnitudeScoringFunction

Definierar en funktion som ökar poängen baserat på storleken på ett numeriskt fält.

MagnitudeScoringParameters

Ger parametervärden till en bedömningsfunktion för magnituden.

MappingCharFilter

Ett teckenfilter som tillämpar mappningar som definierats med alternativet mappningar. Matchningen är girig (längst mönstermatchning vid en given poäng vinner). Ersättning tillåts vara den tomma strängen. Det här teckenfiltret implementeras med Apache Lucene.

MicrosoftLanguageStemmingTokenizer

Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.

MicrosoftLanguageTokenizer

Delar upp text med hjälp av språkspecifika regler.

MicrosoftStemmingTokenizerLanguage

Listar de språk som stöds av Microsoft language stemming tokenizer.

MicrosoftTokenizerLanguage

Listar de språk som stöds av Microsoft språktokenizer.

NGramTokenFilter

Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.

NGramTokenFilterV2

Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.

NGramTokenizer

Tokeniserar indata till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.

PathHierarchyTokenizerV2

Tokenizer för sökvägsliknande hierarkier. Den här tokenizern implementeras med Apache Lucene.

PatternAnalyzer

Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Den här analysatorn implementeras med Apache Lucene.

PatternCaptureTokenFilter

Använder Java-regexer för att generera flera token – en för varje insamlingsgrupp i ett eller flera mönster. Det här tokenfiltret implementeras med Apache Lucene.

PatternReplaceCharFilter

Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här teckenfiltret implementeras med Apache Lucene.

PatternReplaceTokenFilter

Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här tokenfiltret implementeras med Apache Lucene.

PatternTokenizer

Tokenizer som använder regex-mönstermatchning för att konstruera distinkta token. Den här tokenizern implementeras med Apache Lucene.

PhoneticEncoder

Identifierar vilken typ av fonetisk kodare som ska användas med en PhoneticTokenFilter.

PhoneticTokenFilter

Skapa token för fonetiska matchningar. Det här tokenfiltret implementeras med Apache Lucene.

RankingOrder

Representerar poäng som ska användas för sorteringsordning för dokument.

RescoringOptions

Innehåller alternativ för omskolning.

ScalarQuantizationCompression

Innehåller konfigurationsalternativ som är specifika för den skalära kvantiseringskomprimeringsmetod som används vid indexering och frågor.

ScalarQuantizationParameters

Innehåller de parametrar som är specifika för Scalar Quantization.

ScoringFunctionAggregation

Definierar den aggregeringsfunktion som används för att kombinera resultaten av alla bedömningsfunktioner i en bedömningsprofil.

ScoringFunctionInterpolation

Definierar den funktion som används för att interpolera poängökning i en rad dokument.

ScoringProfile

Definierar parametrar för ett sökindex som påverkar bedömning i sökfrågor.

SearchField

Representerar ett fält i en indexdefinition som beskriver namn, datatyp och sökbeteende för ett fält.

SearchFieldDataType

Definierar datatypen för ett fält i ett sökindex.

SearchIndex

Representerar en sökindexdefinition som beskriver fälten och sökbeteendet för ett index.

SearchIndexerDataNoneIdentity

Rensar identitetsegenskapen för en datakälla.

SearchIndexerDataUserAssignedIdentity

Anger identiteten för en datakälla som ska användas.

SearchResourceEncryptionKey

En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar.

SearchSuggester

Definierar hur Api för förslag ska tillämpas på en grupp fält i indexet.

SemanticConfiguration

Definierar en specifik konfiguration som ska användas i samband med semantiska funktioner.

SemanticField

Ett fält som används som en del av den semantiska konfigurationen.

SemanticPrioritizedFields

Beskriver fälten rubrik, innehåll och nyckelord som ska användas för semantisk rangordning, undertexter, markeringar och svar.

SemanticSearch

Definierar parametrar för ett sökindex som påverkar semantiska funktioner.

ShingleTokenFilter

Skapar kombinationer av tokens till en enda token. Det här tokenfiltret implementeras med Apache Lucene.

SnowballTokenFilter

Ett filter som stjälkar ord med hjälp av en Snowball-genererad stemmer. Det här tokenfiltret implementeras med Apache Lucene.

SnowballTokenFilterLanguage

Det språk som ska användas för ett Snowball-tokenfilter.

StemmerOverrideTokenFilter

Ger möjlighet att åsidosätta andra härdningsfilter med anpassad ordlistebaserad härdning. Ordlisteskaftade termer markeras som nyckelord så att de inte kommer att stoppas med stemmers längre ned i kedjan. Måste placeras före eventuella härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html

StemmerTokenFilter

Språkspecifikt härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

StemmerTokenFilterLanguage

Det språk som ska användas för ett stemmer-tokenfilter.

StopAnalyzer

Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Den här analysatorn implementeras med Apache Lucene.

StopwordsList

Identifierar en fördefinierad lista med språkspecifika stoppord.

StopwordsTokenFilter

Tar bort stoppord från en tokenström. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

SynonymTokenFilter

Matchar synonymer med en eller flera ord i en tokenström. Det här tokenfiltret implementeras med Apache Lucene.

TagScoringFunction

Definierar en funktion som ökar antalet dokument med strängvärden som matchar en viss lista med taggar.

TagScoringParameters

Ger parametervärden till en taggbedömningsfunktion.

TextWeights

Definierar vikter för indexfält för vilka matchningar ska öka poängsättningen i sökfrågor.

TokenCharacterKind

Representerar klasser av tecken som ett tokenfilter kan användas på.

TokenFilterName

Definierar namnen på alla tokenfilter som stöds av sökmotorn.

TruncateTokenFilter

Trunkerar termerna till en viss längd. Det här tokenfiltret implementeras med Apache Lucene.

UaxUrlEmailTokenizer

Tokeniserar URL:er och e-postmeddelanden som en token. Den här tokenizern implementeras med Apache Lucene.

UniqueTokenFilter

Filtrerar bort token med samma text som föregående token. Det här tokenfiltret implementeras med Apache Lucene.

VectorEncodingFormat

Kodningsformatet för tolkning av vektorfältinnehåll.

VectorSearch

Innehåller konfigurationsalternativ som rör vektorsökning.

VectorSearchAlgorithmKind

Algoritmen som används för indexering och frågor.

VectorSearchAlgorithmMetric

Likhetsmåttet som ska användas för vektorjämförelser. Vi rekommenderar att du väljer samma likhetsmått som inbäddningsmodellen tränades på.

VectorSearchCompressionKind

Den komprimeringsmetod som används för indexering och frågor.

VectorSearchCompressionTarget

Den kvantiserade datatypen för komprimerade vektorvärden.

VectorSearchProfile

Definierar en kombination av konfigurationer som ska användas med vektorsökning.

VectorSearchVectorizerKind

Den vektoriseringsmetod som ska användas under frågetiden.

WebApiVectorizer

Anger en användardefinierad vektoriserare för att generera vektorbäddning av en frågesträng. Integrering av en extern vektoriserare uppnås med hjälp av det anpassade webb-API-gränssnittet för en kompetensuppsättning.

WebApiVectorizerParameters

Anger egenskaperna för att ansluta till en användardefinierad vektoriserare.

WordDelimiterTokenFilter

Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene.

Accept

Acceptera-rubriken.

Värde Description
application/json;odata.metadata=minimal

AIFoundryModelCatalogName

Namnet på den inbäddningsmodell som kommer att kallas från Azure AI Foundry Catalog.

Värde Description
OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32

OpenAI-CLIP-Image-Text-Embeddings-vit-base-patch32

OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336

OpenAI-CLIP-Image-Text-Embeddings-ViT-Large-Patch14-336

Facebook-DinoV2-Image-Embeddings-ViT-Base

Facebook-DinoV2-bildinbäddningar-ViT-Base

Facebook-DinoV2-Image-Embeddings-ViT-Giant

Facebook-DinoV2-Bildinbäddningar-ViT-Giant

Cohere-embed-v3-english

Cohere-embed-v3-english

Cohere-embed-v3-multilingual

Cohere-embed-v3-multilingual

Cohere-embed-v4

Cohere embed v4-modell för att generera inbäddningar från både text och bilder.

AMLParameters

Anger egenskaperna för att ansluta till en AML-vektoriserare.

Name Typ Description
key

string

(Krävs för nyckelautentisering) Nyckeln för AML-tjänsten.

modelName

AIFoundryModelCatalogName

Namnet på inbäddningsmodellen från Azure AI Foundry Catalog som distribueras vid den tillhandahållna slutpunkten.

region

string

(Valfritt för tokenautentisering). Den region som AML-tjänsten distribueras i.

resourceId

string

(Krävs för tokenautentisering). Azure Resource Manager-resurs-ID för AML-tjänsten. Det borde vara i formatet subscriptions/{guid}/resourceGroups/{resource-group-name}/Microsoft. MachineLearningServices/workspaces/{workspace-name}/services/{service_name}.

timeout

string (duration)

(Valfritt) När det anges anger du tidsgränsen för http-klienten som gör API-anropet.

uri

string (uri)

(Krävs för ingen autentisering eller nyckelautentisering) Bedömnings-URI för AML-tjänsten som JSON-nyttolasten ska skickas till. Endast https-URI-schemat tillåts.

AMLVectorizer

Specificerar en Azure Machine Learning-endpoint som distribueras via Azure AI Foundry Model Catalog för att generera vektorinbäddning av en frågesträng.

Name Typ Description
amlParameters

AMLParameters

Anger egenskaperna för AML-vektoriseraren.

kind string:

aml

Typ av VectorSearchVectorizer.

name

string

Namnet som ska associeras med den här specifika vektoriseringsmetoden.

AsciiFoldingTokenFilter

Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.AsciiFoldingTokenFilter

Diskrimineringen för härledda typer.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

preserveOriginal

boolean

False

Ett värde som anger om den ursprungliga token ska behållas. Standardvärdet är false.

AzureOpenAIModelName

Namnet på Azure Open AI-modellen som ska anropas.

Värde Description
text-embedding-ada-002

TextEmbeddingAda002-modellen.

text-embedding-3-large

TextEmbedding3Stor modell.

text-embedding-3-small

TextEmbedding3Small-modellen.

gpt-5-mini

Gpt5Mini-modell.

gpt-5-nano

Gpt5Nano-modellen.

gpt-5.4-mini

Gpt54Mini-modell.

gpt-5.4-nano

Gpt54Nano-modellen.

AzureOpenAIVectorizer

Anger den Azure OpenAI-resurs som används för att vektorisera en frågesträng.

Name Typ Description
azureOpenAIParameters

AzureOpenAIVectorizerParameters

Innehåller de parametrar som är specifika för Azure OpenAI-inbäddningsvektorisering.

kind string:

azureOpenAI

Typ av VectorSearchVectorizer.

name

string

Namnet som ska associeras med den här specifika vektoriseringsmetoden.

AzureOpenAIVectorizerParameters

Anger parametrarna för att ansluta till Azure OpenAI-resursen.

Name Typ Description
apiKey

string

API-nyckeln för den avsedda Azure OpenAI-resursen.

authIdentity SearchIndexerDataIdentity:

Den användartilldelade hanterade identiteten som används för utgående anslutningar.

deploymentId

string

ID för Azure OpenAI-modelldistributionen på den avsedda resursen.

modelName

AzureOpenAIModelName

Namnet på den inbäddningsmodell som distribueras på den angivna deploymentId-sökvägen.

resourceUri

string (uri)

Resurs-URI för Azure OpenAI-resursen.

BinaryQuantizationCompression

Innehåller konfigurationsalternativ som är specifika för den binära kvantiseringskomprimeringsmetod som används vid indexering och frågor.

Name Typ Description
kind string:

binaryQuantization

Typ av VectorSearchKompression.

name

string

Namnet som ska associeras med den här konfigurationen.

rescoringOptions

RescoringOptions

Innehåller alternativ för omskolning.

truncationDimension

integer (int32)

Antalet dimensioner som vektorerna ska trunkeras till. Om du trunkerar vektorerna minskar storleken på vektorerna och mängden data som måste överföras under sökningen. Detta kan spara lagringskostnader och förbättra sökprestanda på bekostnad av återkallande. Den bör endast användas för inbäddningar som tränats med Matryoshka Representation Learning (MRL) som OpenAI textinbäddning-3-large (liten). Standardvärdet är null, vilket innebär ingen trunkering.

BM25SimilarityAlgorithm

Rankningsfunktion baserat på Okapi BM25-likhetsalgoritmen. BM25 är en TF-IDF-liknande algoritm som innehåller längdnormalisering (styrs av parametern "b" samt termfrekvensmättnad (styrs av parametern k1).

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.BM25Similarity

Diskrimineringen för härledda typer.

b

number (double)

Den här egenskapen styr hur längden på ett dokument påverkar relevanspoängen. Som standard används värdet 0,75. Värdet 0,0 innebär att ingen längdnormalisering tillämpas, medan värdet 1,0 innebär att poängen normaliseras helt av dokumentets längd.

k1

number (double)

Den här egenskapen styr skalningsfunktionen mellan termfrekvensen för varje matchande termer och den slutliga relevanspoängen för ett dokumentfrågepar. Som standard används värdet 1.2. Värdet 0,0 innebär att poängen inte skalas med en ökning av termfrekvensen.

CharFilterName

Definierar namnen på alla teckenfilter som stöds av sökmotorn.

Värde Description
html_strip

Ett teckenfilter som försöker ta bort HTML-konstruktioner. Se https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/charfilter/HTMLStripCharFilter.html

CjkBigramTokenFilter

Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.CjkBigramTokenFilter

Diskrimineringen för härledda typer.

ignoreScripts

CjkBigramTokenFilterScripts[]

Skripten som ska ignoreras.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

outputUnigrams

boolean

False

Ett värde som anger om både unigram och bigrams ska matas ut (om de är sanna) eller bara bigrams (om de är falska). Standardvärdet är false.

CjkBigramTokenFilterScripts

Skript som kan ignoreras av CjkBigramTokenFilter.

Värde Description
han

Ignorera Han-skript när du skapar bigram av CJK-termer.

hiragana

Ignorera hiragana-skrift när du bildar bigram av CJK-termer.

katakana

Ignorera Katakana-skrift när du skapar bigram av CJK-termer.

hangul

Ignorera Hangul-skrift när du bildar bigram av CJK-termer.

ClassicSimilarityAlgorithm

Äldre likhetsalgoritm som använder Lucene TFIDFSimilarity-implementeringen av TF-IDF. Den här varianten av TF-IDF introducerar normalisering av statisk dokumentlängd samt koordineringsfaktorer som straffar dokument som endast delvis matchar de sökta frågorna.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.ClassicSimilarity

Diskrimineringen för härledda typer.

ClassicTokenizer

Grammatikbaserad tokenizer som är lämplig för bearbetning av de flesta europeiska dokument. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.ClassicTokenizer

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

CommonGramTokenFilter

Skapa bigrams för ofta förekommande termer vid indexering. Enkla termer indexeras också, med bigrams överlagrade. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.CommonGramTokenFilter

Diskrimineringen för härledda typer.

commonWords

string[]

Uppsättningen vanliga ord.

ignoreCase

boolean

False

Ett värde som anger om vanliga ord som matchar är skiftlägesokänsliga. Standardvärdet är false.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

queryMode

boolean

False

Ett värde som anger om tokenfiltret är i frågeläge. I frågeläge genererar tokenfiltret bigrams och tar sedan bort vanliga ord och enkla termer följt av ett vanligt ord. Standardvärdet är false.

CorsOptions

Definierar alternativ för att styra resursdelning mellan ursprung (CORS) för ett index.

Name Typ Description
allowedOrigins

string[]

Listan över ursprung som JavaScript-koden ska beviljas åtkomst till ditt index från. Kan innehålla en lista över värdar i formatet {protocol}://{fully-qualified-domain-name}[:{port#}], eller en enda "*" för att tillåta alla ursprung (rekommenderas inte).

maxAgeInSeconds

integer (int64)

Den varaktighet under vilken webbläsare ska cachelagra CORS-preflight-svar. Standardvärdet är 5 minuter.

CustomAnalyzer

Gör att du kan ta kontroll över processen att konvertera text till indexerbara/sökbara token. Det är en användardefinierad konfiguration som består av en enda fördefinierad tokenizer och ett eller flera filter. Tokenizern ansvarar för att dela upp text i token och filter för att ändra token som genereras av tokenizern.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.CustomAnalyzer

Diskrimineringen för härledda typer.

charFilters

CharFilterName[]

En lista över teckenfilter som används för att förbereda indatatext innan den bearbetas av tokeniseraren. De kan till exempel ersätta vissa tecken eller symboler. Filtren körs i den ordning de visas.

name

string

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

tokenFilters

TokenFilterName[]

En lista över tokenfilter som används för att filtrera bort eller ändra de token som genereras av en tokeniserare. Du kan till exempel ange ett filter för gemener som konverterar alla tecken till gemener. Filtren körs i den ordning de visas.

tokenizer

LexicalTokenizerName

Namnet på tokeniseraren som ska användas för att dela upp kontinuerlig text i en sekvens med token, till exempel att dela upp en mening i ord.

CustomNormalizer

Gör att du kan konfigurera normalisering för filterbara, sorterbara och fasettbara fält, som som standard fungerar med strikt matchning. Det här är en användardefinierad konfiguration som består av minst ett eller flera filter som ändrar den token som lagras.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.CustomNormalizer

Diskrimineringen för härledda typer.

charFilters

CharFilterName[]

En lista över teckenfilter som används för att förbereda indatatext innan den bearbetas. De kan till exempel ersätta vissa tecken eller symboler. Filtren körs i den ordning de visas.

name

string

Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

tokenFilters

TokenFilterName[]

En lista över tokenfilter som används för att filtrera bort eller ändra indatatoken. Du kan till exempel ange ett filter för gemener som konverterar alla tecken till gemener. Filtren körs i den ordning de visas.

DictionaryDecompounderTokenFilter

Sönderdelar sammansatta ord som finns i många germanska språk. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.DictionaryDecompounderTokenFilter

Diskrimineringen för härledda typer.

maxSubwordSize

integer (int32)

maximum: 300
15

Den maximala underordsstorleken. Endast underord som är kortare än detta matas ut. Standardvärdet är 15. Maxvärdet är 300.

minSubwordSize

integer (int32)

maximum: 300
2

Minsta underordsstorlek. Endast underord som är längre än detta matas ut. Standardvärdet är 2. Maxvärdet är 300.

minWordSize

integer (int32)

maximum: 300
5

Minsta ordstorlek. Endast ord som är längre än detta bearbetas. Standardvärdet är 5. Maxvärdet är 300.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

onlyLongestMatch

boolean

False

Ett värde som anger om du bara vill lägga till det längsta matchande underordet i utdata. Standardvärdet är false.

wordList

string[]

Listan med ord som ska matchas mot.

DistanceScoringFunction

Definierar en funktion som ökar poängen baserat på avståndet från en geografisk plats.

Name Typ Description
boost

number (double)

En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0.

distance

DistanceScoringParameters

Parametervärden för funktionen för avståndsbedömning.

fieldName

string

Namnet på fältet som används som indata till bedömningsfunktionen.

interpolation

ScoringFunctionInterpolation

Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär".

type string:

distance

Typ av poängfunktion.

DistanceScoringParameters

Ger parametervärden till en funktion för avståndsbedömning.

Name Typ Description
boostingDistance

number (double)

Avståndet i kilometer från referensplatsen där förstärkningsområdet slutar.

referencePointParameter

string

Namnet på parametern som skickas i sökfrågor för att ange referensplatsen.

EdgeNGramTokenFilter

Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilter

Diskrimineringen för härledda typer.

maxGram

integer (int32)

2

Den maximala n-gramlängden. Standardvärdet är 2.

minGram

integer (int32)

1

Minsta n-gramlängd. Standard är 1. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

side

EdgeNGramTokenFilterSide

front

Anger vilken sida av indata n-grammet ska genereras från. Standard är "front".

EdgeNGramTokenFilterSide

Anger vilken sida av indata ett n-gram ska genereras från.

Värde Description
front

Anger att n-grammet ska genereras från indatans framsida.

back

Anger att n-grammet ska genereras från baksidan av indata.

EdgeNGramTokenFilterV2

Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenFilterV2

Diskrimineringen för härledda typer.

maxGram

integer (int32)

maximum: 300
2

Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300.

minGram

integer (int32)

maximum: 300
1

Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

side

EdgeNGramTokenFilterSide

front

Anger vilken sida av indata n-grammet ska genereras från. Standard är "front".

EdgeNGramTokenizer

Tokeniserar indata från en kant till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.EdgeNGramTokenizer

Diskrimineringen för härledda typer.

maxGram

integer (int32)

maximum: 300
2

Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300.

minGram

integer (int32)

maximum: 300
1

Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

tokenChars

TokenCharacterKind[]

Teckenklasser som ska behållas i token.

ElisionTokenFilter

Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.ElisionTokenFilter

Diskrimineringen för härledda typer.

articles

string[]

Den uppsättning artiklar som ska tas bort.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

ErrorAdditionalInfo

Ytterligare information om resurshanteringsfelet.

Name Typ Description
info

Den ytterligare informationen.

type

string

Typen av ytterligare information.

ErrorDetail

Felinformationen.

Name Typ Description
additionalInfo

ErrorAdditionalInfo[]

Felet ytterligare information.

code

string

Felkoden.

details

ErrorDetail[]

Felinformationen.

message

string

Felmeddelandet.

target

string

Felmålet.

ErrorResponse

Vanligt felsvar för alla Azure Resource Manager-API:er för att returnera felinformation för misslyckade åtgärder. (Detta följer även formatet för OData-felsvar.).

Name Typ Description
error

ErrorDetail

Felet objektet.

ExhaustiveKnnAlgorithmConfiguration

Innehåller konfigurationsalternativ som är specifika för den fullständiga KNN-algoritmen som används vid frågor, som utför brute-force-sökning i hela vektorindexet.

Name Typ Description
exhaustiveKnnParameters

ExhaustiveKnnParameters

Innehåller parametrarna som är specifika för en fullständig KNN-algoritm.

kind string:

exhaustiveKnn

Typ av VectorSearchAlgorithmConfiguration.

name

string

Namnet som ska associeras med den här konfigurationen.

ExhaustiveKnnParameters

Innehåller parametrarna som är specifika för en fullständig KNN-algoritm.

Name Typ Description
metric

VectorSearchAlgorithmMetric

Likhetsmåttet som ska användas för vektorjämförelser.

FreshnessScoringFunction

Definierar en funktion som ökar poängen baserat på värdet för ett datum-tid-fält.

Name Typ Description
boost

number (double)

En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0.

fieldName

string

Namnet på fältet som används som indata till bedömningsfunktionen.

freshness

FreshnessScoringParameters

Parametervärden för funktionen för färskhetsbedömning.

interpolation

ScoringFunctionInterpolation

Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär".

type string:

freshness

Typ av poängfunktion.

FreshnessScoringParameters

Ger parametervärden till en funktion för färskhetsbedömning.

Name Typ Description
boostingDuration

string (duration)

Förfalloperioden efter vilken förstärkningen stoppas för ett visst dokument.

HnswAlgorithmConfiguration

Innehåller konfigurationsalternativ som är specifika för algoritmen HNSW för ungefärliga närmaste grannar som används vid indexering och frågor. HNSW-algoritmen erbjuder en justerbar avvägning mellan sökhastighet och noggrannhet.

Name Typ Description
hnswParameters

HnswParameters

Innehåller de parametrar som är specifika för HNSW-algoritmen.

kind string:

hnsw

Typ av VectorSearchAlgorithmConfiguration.

name

string

Namnet som ska associeras med den här konfigurationen.

HnswParameters

Innehåller de parametrar som är specifika för HNSW-algoritmen.

Name Typ Standardvärde Description
efConstruction

integer (int32)

minimum: 100
maximum: 1000
400

Storleken på den dynamiska listan som innehåller de närmaste grannarna, som används under indexeringstiden. Om du ökar den här parametern kan indexkvaliteten förbättras på bekostnad av ökad indexeringstid. Vid en viss punkt leder en ökning av denna parameter till minskande avkastning.

efSearch

integer (int32)

minimum: 100
maximum: 1000
500

Storleken på den dynamiska listan som innehåller de närmaste grannarna, som används under söktiden. Om du ökar den här parametern kan sökresultaten förbättras på bekostnad av långsammare sökning. Vid en viss punkt leder en ökning av denna parameter till minskande avkastning.

m

integer (int32)

minimum: 4
maximum: 10
4

Antalet dubbelriktade länkar som skapas för varje nytt element under konstruktionen. Att öka det här parametervärdet kan förbättra träffsäkerheten och minska hämtningstiderna för datauppsättningar med hög inneboende dimensionalitet på bekostnad av ökad minnesförbrukning och längre indexeringstid.

metric

VectorSearchAlgorithmMetric

Likhetsmåttet som ska användas för vektorjämförelser.

KeepTokenFilter

Ett tokenfilter som bara behåller token med text i en angiven lista med ord. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.KeepTokenFilter

Diskrimineringen för härledda typer.

keepWords

string[]

Listan med ord att behålla.

keepWordsCase

boolean

False

Ett värde som anger om alla ord ska sänkas först. Standardvärdet är false.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

KeywordMarkerTokenFilter

Markerar termer som nyckelord. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.KeywordMarkerTokenFilter

Diskrimineringen för härledda typer.

ignoreCase

boolean

False

Ett värde som anger om skiftläge ska ignoreras. Om sant konverteras alla ord till gemener först. Standardvärdet är false.

keywords

string[]

En lista med ord som ska markeras som nyckelord.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

KeywordTokenizer

Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizer

Diskrimineringen för härledda typer.

bufferSize

integer (int32)

256

Storleken på läsbufferten i byte. Standardvärdet är 256.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

KeywordTokenizerV2

Genererar hela indata som en enda token. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.KeywordTokenizerV2

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

maximum: 300
256

Maximal tokenlängd. Standardvärdet är 256. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

LengthTokenFilter

Tar bort ord som är för långa eller för korta. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.LengthTokenFilter

Diskrimineringen för härledda typer.

max

integer (int32)

maximum: 300
300

Maximal längd på tecken. Standard och max är 300.

min

integer (int32)

maximum: 300
0

Minsta längd i tecken. Standardvärdet är 0. Maxvärdet är 300. Måste vara mindre än värdet för max.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

LexicalAnalyzerName

Definierar namnen på alla textanalysverktyg som stöds av sökmotorn.

Värde Description
ar.microsoft

Microsoft-analysator för arabiska.

ar.lucene

Lucene-analysator för arabiska.

hy.lucene

Lucene-analysator för armeniska.

bn.microsoft

Microsoft-analysator för bangla.

eu.lucene

Lucene analysator för baskiska.

bg.microsoft

Microsoft analyzer för bulgariska.

bg.lucene

Lucene-analysator för bulgariska.

ca.microsoft

Microsoft-analysator för katalanska.

ca.lucene

Lucene-analysator för katalanska.

zh-Hans.microsoft

Microsoft-analysator för kinesiska (förenklad).

zh-Hans.lucene

Lucene-analysator för kinesiska (förenklad).

zh-Hant.microsoft

Microsoft-analysator för kinesiska (traditionella).

zh-Hant.lucene

Lucene-analysator för kinesiska (traditionell).

hr.microsoft

Microsoft analyzer för kroatiska.

cs.microsoft

Microsoft-analysator för tjeckiska.

cs.lucene

Lucene-analysator för tjeckiska.

da.microsoft

Microsoft-analysator för danska.

da.lucene

Lucene-analysator för danska.

nl.microsoft

Microsoft-analysator för nederländska.

nl.lucene

Lucene-analysator för nederländska.

en.microsoft

Microsoft-analysator för engelska.

en.lucene

Lucene-analysator för engelska.

et.microsoft

Microsoft analyzer för estniska.

fi.microsoft

Microsoft-analysator för finska.

fi.lucene

Lucene-analysator för finska.

fr.microsoft

Microsoft-analysator för franska.

fr.lucene

Lucene-analysator för franska.

gl.lucene

Lucene-analysator för galiciska.

de.microsoft

Microsoft-analysator för tyska.

de.lucene

Lucene-analysator för tyska.

el.microsoft

Microsoft-analysator för Grekiska.

el.lucene

Lucene-analysator för grekiska.

gu.microsoft

Microsoft-analysator för gujarati.

he.microsoft

Microsoft-analysator för hebreiska.

hi.microsoft

Microsoft-analysator för hindi.

hi.lucene

Lucene-analysator för hindi.

hu.microsoft

Microsoft-analysator för ungerska.

hu.lucene

Lucene-analysator för ungerska.

is.microsoft

Microsoft-analysator för isländska.

id.microsoft

Microsoft-analysator för indonesiska (Bahasa).

id.lucene

Lucene-analysator för indonesiska.

ga.lucene

Lucene-analysator för irländska.

it.microsoft

Microsoft analyzer för italienska.

it.lucene

Lucene-analysator för italienska.

ja.microsoft

Microsoft-analysator för japanska.

ja.lucene

Lucene-analysator för japanska.

kn.microsoft

Microsoft analyzer för kannada.

ko.microsoft

Microsoft-analysator för koreanska.

ko.lucene

Lucene-analysator för koreanska.

lv.microsoft

Microsoft-analysator för lettiska.

lv.lucene

Lucene-analysator för lettiska.

lt.microsoft

Microsoft analyzer för litauiska.

ml.microsoft

Microsoft-analysator för malayalam.

ms.microsoft

Microsoft-analysator för malajiska (latin).

mr.microsoft

Microsoft-analysator för marathi.

nb.microsoft

Microsoft analyzer for Norwegian (Bokmül).

no.lucene

Lucene-analysator för norska.

fa.lucene

Lucene-analysator för persiska.

pl.microsoft

Microsoft-analysator för polska.

pl.lucene

Lucene-analysator för polska.

pt-BR.microsoft

Microsoft analyzer för portugisiska (Brasilien).

pt-BR.lucene

Lucene-analysator för portugisiska (Brasilien).

pt-PT.microsoft

Microsoft analyzer for Portuguese (Portugal).

pt-PT.lucene

Lucene-analysator för portugisiska (Portugal).

pa.microsoft

Microsoft-analysator för punjabi.

ro.microsoft

Microsoft-analysator för rumänska.

ro.lucene

Lucene-analysator för rumänska.

ru.microsoft

Microsoft-analysator för ryska.

ru.lucene

Lucene-analysator för ryska.

sr-cyrillic.microsoft

Microsoft analyzer för serbiska (kyrilliska).

sr-latin.microsoft

Microsoft analyzer för serbiska (latin).

sk.microsoft

Microsoft-analysator för slovakiska.

sl.microsoft

Microsoft analyzer for Slovenian.

es.microsoft

Microsoft-analysator för spanska.

es.lucene

Lucene-analysator för spanska.

sv.microsoft

Microsoft-analysator för svenska.

sv.lucene

Lucene analysator för svenska.

ta.microsoft

Microsoft-analysator för tamil.

te.microsoft

Microsoft analyzer för telugu.

th.microsoft

Microsoft-analysator för thailändska.

th.lucene

Lucene-analysator för thailändska.

tr.microsoft

Microsoft-analysator för turkiskt.

tr.lucene

Lucene-analysator för turkiska.

uk.microsoft

Microsoft-analysator för ukrainska.

ur.microsoft

Microsoft-analysator för urdu.

vi.microsoft

Microsoft-analysator för vietnamesiska.

standard.lucene

Lucene-analysator som standard.

standardasciifolding.lucene

Standard ASCII vikning Lucene-analysator. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#Analyzers

keyword

Behandlar hela innehållet i ett fält som en enda token. Detta är användbart för data som postnummer, ID och vissa produktnamn. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordAnalyzer.html

pattern

Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/PatternAnalyzer.html

simple

Delar upp text med icke-bokstäver och konverterar dem till gemener. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/SimpleAnalyzer.html

stop

Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopAnalyzer.html

whitespace

En analysator som använder mellanslagstokeniseraren. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceAnalyzer.html

LexicalNormalizerName

Definierar namnen på alla textnormaliserare som stöds av sökmotorn.

Värde Description
asciifolding

Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

elision

Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

lowercase

Normaliserar tokentext till gemener. Se https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

standard

Standardnormaliserare, som består av gemener och asciifolding. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

uppercase

Normaliserar tokentext till versaler. Se https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

LexicalTokenizerName

Definierar namnen på alla tokeniserare som stöds av sökmotorn.

Värde Description
classic

Grammatikbaserad tokenizer som är lämplig för bearbetning av de flesta europeiska dokument. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicTokenizer.html

edgeNGram

Tokeniserar indata från en kant till n-gram av de angivna storlekarna. Se https://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenizer.html

keyword_v2

Genererar hela indata som en enda token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/KeywordTokenizer.html

letter

Delar upp text med icke-bokstäver. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LetterTokenizer.html

lowercase

Delar upp text med icke-bokstäver och konverterar dem till gemener. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/LowerCaseTokenizer.html

microsoft_language_tokenizer

Delar upp text med hjälp av språkspecifika regler.

microsoft_language_stemming_tokenizer

Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.

nGram

Tokeniserar indata till n-gram av de angivna storlekarna. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenizer.html

path_hierarchy_v2

Tokenizer för sökvägsliknande hierarkier. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/path/PathHierarchyTokenizer.html

pattern

Tokenizer som använder regex-mönstermatchning för att konstruera distinkta token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/pattern/PatternTokenizer.html

standard_v2

Standard Lucene analyzer; Består av standardtokeniseraren, gemener och stoppfilter. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/StandardTokenizer.html

uax_url_email

Tokeniserar URL:er och e-postmeddelanden som en token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/UAX29URLEmailTokenizer.html

whitespace

Delar upp text vid blanksteg. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/WhitespaceTokenizer.html

LimitTokenFilter

Begränsar antalet token vid indexering. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.LimitTokenFilter

Diskrimineringen för härledda typer.

consumeAllTokens

boolean

False

Ett värde som anger om alla token från indata måste förbrukas även om maxTokenCount har nåtts. Standardvärdet är false.

maxTokenCount

integer (int32)

1

Det maximala antalet token som ska skapas. Standard är 1.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

LuceneStandardAnalyzer

Apache Lucene-analysverktyg av standardstandard; Består av standardtokeniseraren, gemener och stoppfilter.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.StandardAnalyzer

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken.

name

string

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

stopwords

string[]

En lista över stoppord.

LuceneStandardTokenizer

Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizer

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

255

Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

LuceneStandardTokenizerV2

Bryter text efter Unicode-reglerna för textsegmentering. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.StandardTokenizerV2

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

MagnitudeScoringFunction

Definierar en funktion som ökar poängen baserat på storleken på ett numeriskt fält.

Name Typ Description
boost

number (double)

En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0.

fieldName

string

Namnet på fältet som används som indata till bedömningsfunktionen.

interpolation

ScoringFunctionInterpolation

Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär".

magnitude

MagnitudeScoringParameters

Parametervärden för funktionen för storleksbedömning.

type string:

magnitude

Typ av poängfunktion.

MagnitudeScoringParameters

Ger parametervärden till en bedömningsfunktion för magnituden.

Name Typ Description
boostingRangeEnd

number (double)

Fältvärdet där förstärkningen slutar.

boostingRangeStart

number (double)

Fältvärdet som boostingen startar vid.

constantBoostBeyondRange

boolean

Ett värde som anger om en konstant ökning av fältvärden ska tillämpas utöver intervallets slutvärde. Standardvärdet är false.

MappingCharFilter

Ett teckenfilter som tillämpar mappningar som definierats med alternativet mappningar. Matchningen är girig (längst mönstermatchning vid en given poäng vinner). Ersättning tillåts vara den tomma strängen. Det här teckenfiltret implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.MappingCharFilter

Diskrimineringen för härledda typer.

mappings

string[]

En lista över mappningar i följande format: "a=>b" (alla förekomster av tecknet "a" ersätts med tecknet "b").

name

string

Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

MicrosoftLanguageStemmingTokenizer

Delar upp text med hjälp av språkspecifika regler och reducerar ord till deras basformulär.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageStemmingTokenizer

Diskrimineringen för härledda typer.

isSearchTokenizer

boolean

False

Ett värde som anger hur tokenizern används. Ställ in på sant om det används som söktokeniserare och ange till false om det används som indexeringstokeniserare. Standardvärdet är false.

language

MicrosoftStemmingTokenizerLanguage

Språket som ska användas. Standardvärdet är engelska.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Token som är längre än den maximala längden delas upp. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token upp baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

MicrosoftLanguageTokenizer

Delar upp text med hjälp av språkspecifika regler.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.MicrosoftLanguageTokenizer

Diskrimineringen för härledda typer.

isSearchTokenizer

boolean

False

Ett värde som anger hur tokenizern används. Ställ in på sant om det används som söktokeniserare och ange till false om det används som indexeringstokeniserare. Standardvärdet är false.

language

MicrosoftTokenizerLanguage

Språket som ska användas. Standardvärdet är engelska.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Token som är längre än den maximala längden delas upp. Maximal tokenlängd som kan användas är 300 tecken. Token som är längre än 300 tecken delas först upp i token med längd 300 och sedan delas var och en av dessa token upp baserat på den maximala tokenlängdsuppsättningen. Standardvärdet är 255.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

MicrosoftStemmingTokenizerLanguage

Listar de språk som stöds av Microsoft language stemming tokenizer.

Värde Description
arabic

Väljer Microsoft Stemming tokenizer för arabiska.

bangla

Väljer Microsoft stemming-tokenizer för bengali.

bulgarian

Väljer Microsoft stemming-tokenizer för bulgariska.

catalan

Väljer Microsoft stemming-tokenizer för katalanska.

croatian

Väljer Microsoft stemming-tokenizer för kroatiska.

czech

Väljer Microsoft stemming-tokenizer för tjeckiska.

danish

Väljer Microsoft stemming-tokenizer för dansk.

dutch

Väljer Microsoft stemming-tokenizer för nederländska.

english

Väljer Microsoft Stemming Tokenizer för engelska.

estonian

Väljer Microsoft stemming tokenizer för estniska.

finnish

Väljer Microsoft stemming-tokenizer för finska.

french

Väljer Microsoft stemming-tokenizer för franska.

german

Väljer Microsoft stemming-tokenizer för tyska.

greek

Väljer Microsoft stemming-tokenizer för Greek.

gujarati

Väljer Microsoft Stemming Tokenizer för Gujarati.

hebrew

Väljer Microsoft stemming-tokenizer för hebreiska.

hindi

Väljer Microsoft stemming tokenizer för hindi.

hungarian

Väljer Microsoft stemming-tokenizer för ungerska.

icelandic

Väljer Microsoft stemming-tokenizer för isländska.

indonesian

Väljer Microsoft stemming tokenizer för indonesiska.

italian

Väljer Microsoft stemming tokenizer för italienska.

kannada

Väljer Microsoft stemming tokenizer för kannada.

latvian

Väljer Microsoft stemming-tokenizer för lettiska.

lithuanian

Väljer Microsoft stemming-tokenizer för litauiska.

malay

Väljer Microsoft stemming-tokenizer för malajiska.

malayalam

Väljer Microsoft stemming-tokenizer för malayalam.

marathi

Väljer Microsoft stemming-tokenizer för marathi.

norwegianBokmaal

Väljer Microsoft stemming tokenizer för norska (Bokmül).

polish

Väljer Microsoft stemming tokenizer för polska.

portuguese

Väljer Microsoft Stemming tokenizer för portugisiska.

portugueseBrazilian

Väljer Microsoft stemming-tokenizer för portugisiska (Brasilien).

punjabi

Väljer Microsoft stemming tokenizer för punjabi.

romanian

Väljer Microsoft stemming-tokenizer för rumänska.

russian

Väljer Microsoft stemming-tokenizer för ryska.

serbianCyrillic

Väljer Microsoft stemming tokenizer för serbiska (kyrilliska).

serbianLatin

Väljer Microsoft stemming tokenizer för serbiska (latin).

slovak

Väljer Microsoft stemming-tokenizer för Slovakiska.

slovenian

Väljer Microsoft stemming tokenizer för slovenska.

spanish

Väljer Microsoft stemming-tokenizer för spanska.

swedish

Väljer Microsoft stemming-tokenizer för svenska.

tamil

Väljer Microsoft stemming tokenizer för tamil.

telugu

Väljer Microsoft stemming-tokenizer för telugu.

turkish

Väljer Microsoft stemming-tokenizer för turkiska.

ukrainian

Väljer Microsoft stemming-tokenizer för ukrainska.

urdu

Väljer Microsoft stemming-tokenizer för urdu.

MicrosoftTokenizerLanguage

Listar de språk som stöds av Microsoft språktokenizer.

Värde Description
bangla

Väljer Microsoft-tokenizern för bengali.

bulgarian

Väljer Microsoft tokenizer för bulgariska.

catalan

Väljer Microsoft-tokenizern för katalanska.

chineseSimplified

Väljer Microsoft-tokenizern för kinesiska (förenklad).

chineseTraditional

Väljer Microsoft-tokenizern för kinesisk (traditionell).

croatian

Väljer Microsoft-tokenizern för kroatiska.

czech

Väljer Microsoft-tokenizern för tjeckiska.

danish

Väljer Microsoft-tokenizern för dansk.

dutch

Väljer Microsoft-tokenizern för nederländska.

english

Väljer Microsoft-tokenizern för engelska.

french

Väljer Microsoft-tokenizern för franska.

german

Väljer Microsoft-tokenizern för tyska.

greek

Väljer Microsoft-tokenizern för Greke.

gujarati

Väljer Microsoft-tokenizern för gujarati.

hindi

Väljer Microsoft-tokenizern för hindi.

icelandic

Väljer Microsoft-tokenizern för isländska.

indonesian

Väljer Microsoft-tokenizern för indonesiska.

italian

Väljer Microsoft-tokenizern för italienska.

japanese

Väljer Microsoft-tokenizern för japanska.

kannada

Väljer Microsoft-tokenizern för kannada.

korean

Väljer Microsoft-tokenizern för koreanska.

malay

Väljer Microsoft-tokenizern för malaj.

malayalam

Väljer Microsoft-tokenizern för malayalam.

marathi

Väljer Microsoft-tokenizern för marathi.

norwegianBokmaal

Väljer Microsoft-tokenizern för norska (Bokmül).

polish

Väljer Microsoft-tokenizern för polska.

portuguese

Väljer Microsoft-tokenizern för portugisiska.

portugueseBrazilian

Väljer Microsoft tokenizer för portugisiska (Brasilien).

punjabi

Väljer Microsoft-tokenizern för punjabi.

romanian

Väljer Microsoft-tokenizern för rumänska.

russian

Väljer Microsoft-tokenizern för ryska.

serbianCyrillic

Väljer Microsoft-tokenizern för serbiska (kyrilliska).

serbianLatin

Väljer Microsoft-tokenizern för serbiska (latin).

slovenian

Väljer Microsoft-tokenizern för slovenska.

spanish

Väljer Microsoft-tokenizern för spanska.

swedish

Väljer Microsoft-tokenizern för svenska.

tamil

Väljer Microsoft-tokenizern för tamil.

telugu

Väljer Microsoft-tokenizern för telugu.

thai

Väljer Microsoft-tokenizern för thailändska.

ukrainian

Väljer Microsoft-tokenizern för ukrainska.

urdu

Väljer Microsoft tokenizer för urdu.

vietnamese

Väljer Microsoft-tokenizern för vietnamesiska.

NGramTokenFilter

Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilter

Diskrimineringen för härledda typer.

maxGram

integer (int32)

2

Den maximala n-gramlängden. Standardvärdet är 2.

minGram

integer (int32)

1

Minsta n-gramlängd. Standard är 1. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

NGramTokenFilterV2

Genererar n-gram av de angivna storlekarna. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenFilterV2

Diskrimineringen för härledda typer.

maxGram

integer (int32)

maximum: 300
2

Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300.

minGram

integer (int32)

maximum: 300
1

Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

NGramTokenizer

Tokeniserar indata till n-gram av de angivna storlekarna. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.NGramTokenizer

Diskrimineringen för härledda typer.

maxGram

integer (int32)

maximum: 300
2

Den maximala n-gramlängden. Standardvärdet är 2. Maxvärdet är 300.

minGram

integer (int32)

maximum: 300
1

Minsta n-gramlängd. Standard är 1. Maxvärdet är 300. Måste vara mindre än värdet för maxGram.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

tokenChars

TokenCharacterKind[]

Teckenklasser som ska behållas i token.

PathHierarchyTokenizerV2

Tokenizer för sökvägsliknande hierarkier. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.PathHierarchyTokenizerV2

Diskrimineringen för härledda typer.

delimiter

string

maxLength: 1
/

Avgränsartecknet som ska användas. Standardvärdet är "/".

maxTokenLength

integer (int32)

maximum: 300
300

Maximal tokenlängd. Standard och max är 300.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

replacement

string

maxLength: 1
/

Ett värde som, om det anges, ersätter avgränsartecknet. Standardvärdet är "/".

reverse

boolean

False

Ett värde som anger om token ska genereras i omvänd ordning. Standardvärdet är false.

skip

integer (int32)

0

Antalet inledande token som ska hoppa över. Standardvärdet är 0.

PatternAnalyzer

Flexibelt delar upp texten i termer med hjälp av ett reguljärt uttrycksmönster. Den här analysatorn implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.PatternAnalyzer

Diskrimineringen för härledda typer.

flags

string

Reguljära uttrycksflaggor, specificerade som en '|' separerad sträng av RegexFlags-värden.

lowercase

boolean

True

Ett värde som anger om termer ska vara gemener. Standardvärdet är sant.

name

string

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

pattern

string

\W+

Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera tecken som inte är ord.

stopwords

string[]

En lista över stoppord.

PatternCaptureTokenFilter

Använder Java-regexer för att generera flera token – en för varje insamlingsgrupp i ett eller flera mönster. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.PatternCaptureTokenFilter

Diskrimineringen för härledda typer.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

patterns

string[]

En lista över mönster som ska matchas mot varje token.

preserveOriginal

boolean

True

Ett värde som anger om den ursprungliga token ska returneras även om något av mönstren matchar. Standardvärdet är sant.

PatternReplaceCharFilter

Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här teckenfiltret implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceCharFilter

Diskrimineringen för härledda typer.

name

string

Namnet på teckenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

pattern

string

Ett mönster för reguljära uttryck.

replacement

string

Ersättningstexten.

PatternReplaceTokenFilter

Ett teckenfilter som ersätter tecken i indatasträngen. Det använder ett reguljärt uttryck för att identifiera teckensekvenser som ska bevaras och ett ersättningsmönster för att identifiera tecken som ska ersättas. Om du till exempel får indatatexten "aa bb aa bb", mönstret "(aa)\s+(bb)" och ersättningen "$1#$2" blir resultatet "aa#bb aa#bb". Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.PatternReplaceTokenFilter

Diskrimineringen för härledda typer.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

pattern

string

Ett mönster för reguljära uttryck.

replacement

string

Ersättningstexten.

PatternTokenizer

Tokenizer som använder regex-mönstermatchning för att konstruera distinkta token. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.PatternTokenizer

Diskrimineringen för härledda typer.

flags

string

Reguljära uttrycksflaggor, specificerade som en '|' separerad sträng av RegexFlags-värden.

group

integer (int32)

-1

Den nollbaserade ordningstalet för den matchande gruppen i mönstret för reguljära uttryck som ska extraheras till token. Använd -1 om du vill använda hela mönstret för att dela upp indata i token, oavsett matchande grupper. Standardvärdet är -1.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

pattern

string

\W+

Ett mönster för reguljära uttryck som matchar tokenavgränsare. Standard är ett uttryck som matchar ett eller flera tecken som inte är ord.

PhoneticEncoder

Identifierar vilken typ av fonetisk kodare som ska användas med en PhoneticTokenFilter.

Värde Description
metaphone

Kodar en token till ett metafonvärde.

doubleMetaphone

Kodar en token till ett dubbelt metafonvärde.

soundex

Kodar en token till ett Soundex-värde.

refinedSoundex

Kodar en token till ett Refined Soundex-värde.

caverphone1

Kodar en token till ett Caverphone 1.0-värde.

caverphone2

Kodar en token till ett Caverphone 2.0-värde.

cologne

Kodar en token till ett fonetiskt värde i Köln.

nysiis

Kodar en token till ett NYSIIS-värde.

koelnerPhonetik

Kodar en token med hjälp av Kölner Phonetik-algoritmen.

haasePhonetik

Kodar en token med hjälp av Haase-förfiningen av Kölner Phonetik-algoritmen.

beiderMorse

Kodar en token till ett Beider-Morse värde.

PhoneticTokenFilter

Skapa token för fonetiska matchningar. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.PhoneticTokenFilter

Diskrimineringen för härledda typer.

encoder

PhoneticEncoder

metaphone

Den fonetiska kodare som ska användas. Standardvärdet är "metafon".

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

replace

boolean

True

Ett värde som anger om kodade token ska ersätta ursprungliga token. Om det är falskt läggs kodade token till som synonymer. Standardvärdet är sant.

RankingOrder

Representerar poäng som ska användas för sorteringsordning för dokument.

Värde Description
BoostedRerankerScore

Ställer in sorteringsordningen som BoostedRerankerScore

RerankerScore

Ställer in sorteringsordning som ReRankerScore

RescoringOptions

Innehåller alternativ för omskolning.

Name Typ Standardvärde Description
defaultOversampling

number (double)

Standardöversamplingsfaktor. Översampling hämtar en större uppsättning potentiella dokument för att kompensera för upplösningsförlusten på grund av kvantisering. Detta ökar uppsättningen resultat som ska poängsättas på nytt på vektorer med full precision. Minimivärdet är 1, vilket innebär att ingen översampling (1x). Den här parametern kan bara anges när "enableRescoring" är sant. Högre värden förbättrar återkallandet på bekostnad av svarstiden.

enableRescoring

boolean

True

Om värdet är true, efter den första sökningen på de komprimerade vektorerna, beräknas likhetspoängen om med hjälp av vektorerna med full precision. Detta förbättrar återkallandet på bekostnad av svarstiden.

rescoreStorageMethod enum:
  • discardOriginals
  • preserveOriginals
preserveOriginals

Styr lagringsmetoden för ursprungliga vektorer. Den här inställningen är oföränderlig.

ScalarQuantizationCompression

Innehåller konfigurationsalternativ som är specifika för den skalära kvantiseringskomprimeringsmetod som används vid indexering och frågor.

Name Typ Description
kind string:

scalarQuantization

Typ av VectorSearchKompression.

name

string

Namnet som ska associeras med den här konfigurationen.

rescoringOptions

RescoringOptions

Innehåller alternativ för omskolning.

scalarQuantizationParameters

ScalarQuantizationParameters

Innehåller de parametrar som är specifika för Scalar Quantization.

truncationDimension

integer (int32)

Antalet dimensioner som vektorerna ska trunkeras till. Om du trunkerar vektorerna minskar storleken på vektorerna och mängden data som måste överföras under sökningen. Detta kan spara lagringskostnader och förbättra sökprestanda på bekostnad av återkallande. Den bör endast användas för inbäddningar som tränats med Matryoshka Representation Learning (MRL) som OpenAI textinbäddning-3-large (liten). Standardvärdet är null, vilket innebär ingen trunkering.

ScalarQuantizationParameters

Innehåller de parametrar som är specifika för Scalar Quantization.

Name Typ Description
quantizedDataType

VectorSearchCompressionTarget

Den kvantiserade datatypen för komprimerade vektorvärden.

ScoringFunctionAggregation

Definierar den aggregeringsfunktion som används för att kombinera resultaten av alla bedömningsfunktioner i en bedömningsprofil.

Värde Description
sum

Öka poängen med summan av alla resultat från bedömningsfunktionen.

average

Öka poängen med medelvärdet av alla poängsättningsfunktionsresultat.

minimum

Öka poängen med ett minimum av alla poängsättningsfunktionsresultat.

maximum

Öka poängen med det maximala av alla poängsättningsfunktionsresultat.

firstMatching

Öka poängen med hjälp av den första tillämpliga poängsättningsfunktionen i bedömningsprofilen.

product

Öka poängen med produkten av alla poängsättningsfunktionsresultat.

ScoringFunctionInterpolation

Definierar den funktion som används för att interpolera poängökning i en rad dokument.

Värde Description
linear

Ökar poängen med ett linjärt minskande belopp. Det här är standardinterpolationen för bedömningsfunktioner.

constant

Ökar poängen med en konstant faktor.

quadratic

Ökar poängen med ett belopp som minskar kvadratiskt. Boostar minskar långsamt för högre poäng och snabbare när poängen minskar. Det här interpolationsalternativet är inte tillåtet i taggbedömningsfunktioner.

logarithmic

Ökar poängen med ett belopp som minskar logaritmiskt. Boostar minskar snabbt för högre poäng och långsammare när poängen minskar. Det här interpolationsalternativet är inte tillåtet i taggbedömningsfunktioner.

ScoringProfile

Definierar parametrar för ett sökindex som påverkar bedömning i sökfrågor.

Name Typ Description
functionAggregation

ScoringFunctionAggregation

Ett värde som anger hur resultaten av enskilda poängsättningsfunktioner ska kombineras. Standardvärdet är "Summa". Ignoreras om det inte finns några poängsättningsfunktioner.

functions ScoringFunction[]:

Samlingen av funktioner som påverkar poängsättningen av dokument.

name

string

Namnet på bedömningsprofilen.

text

TextWeights

Parametrar som ökar poängsättningen baserat på textmatchningar i vissa indexfält.

SearchField

Representerar ett fält i en indexdefinition som beskriver namn, datatyp och sökbeteende för ett fält.

Name Typ Description
analyzer

LexicalAnalyzerName

Namnet på analysatorn som ska användas för fältet. Det här alternativet kan endast användas med sökbara fält och det kan inte ställas in tillsammans med antingen searchAnalyzer eller indexAnalyzer. När analysatorn har valts kan den inte ändras för fältet. Måste vara null för komplexa fält.

dimensions

integer (int32)

minimum: 2
maximum: 4096

Vektorfältets dimensionalitet.

facetable

boolean

Ett värde som anger om fältet ska refereras till i fasetterade frågor. Används vanligtvis i en presentation av sökresultat som inkluderar antal träffar per kategori (till exempel söka efter digitalkameror och se träffar efter varumärke, megapixlar, pris och så vidare). Den här egenskapen måste vara null för komplexa fält. Fält av typen Edm.GeographyPoint eller Collection(Edm.GeographyPoint) kan inte vara fasettbara. Standardvärdet är true för alla andra enkla fält.

fields

SearchField[]

En lista med underfält om det här är ett fält av typen Edm.ComplexType eller Collection(Edm.ComplexType). Måste vara null eller tomt för enkla fält.

filterable

boolean

Ett värde som anger om fältet ska refereras i $filter frågor. filterable skiljer sig från sökbara i hur strängar hanteras. Fält av typen Edm.String eller Collection(Edm.String) som är filterbara genomgår inte ordbrytning, så jämförelser är endast för exakta matchningar. Om du till exempel anger ett sådant fält f till "solig dag" hittar $filter=f eq "sunny" inga matchningar, men $filter=f eq "solig dag" kommer att göra det. Den här egenskapen måste vara null för komplexa fält. Standardvärdet är true för enkla fält och null för komplexa fält.

indexAnalyzer

LexicalAnalyzerName

Namnet på analysatorn som användes vid indexeringstiden för fältet. Det här alternativet kan endast användas med sökbara fält. Den måste anges tillsammans med searchAnalyzer och den kan inte ställas in tillsammans med analysalternativet. Den här egenskapen kan inte anges till namnet på en språkanalysator. använd egenskapen analyzer i stället om du behöver en språkanalysator. När analysatorn har valts kan den inte ändras för fältet. Måste vara null för komplexa fält.

key

boolean

Ett värde som anger om fältet unikt identifierar dokument i indexet. Exakt ett fält på den översta nivån i varje index måste väljas som nyckelfält och det måste vara av typen Edm.String. Nyckelfält kan användas för att söka efter dokument direkt och uppdatera eller ta bort specifika dokument. Standardvärdet är false för enkla fält och null för komplexa fält.

name

string

Namnet på fältet, som måste vara unikt i fältsamlingen för indexet eller det överordnade fältet.

normalizer

LexicalNormalizerName

Namnet på den normaliserare som ska användas för fältet. Det här alternativet kan endast användas med fält som är filtrerbara, sorterbara eller fasettbara aktiverade. När normaliseraren har valts kan den inte ändras för fältet. Måste vara null för komplexa fält.

retrievable

boolean

Ett värde som anger om fältet kan returneras i ett sökresultat. Du kan inaktivera det här alternativet om du vill använda ett fält (till exempel marginal) som filter, sortering eller bedömningsmekanism men inte vill att fältet ska vara synligt för slutanvändaren. Den här egenskapen måste vara true för nyckelfält och den måste vara null för komplexa fält. Den här egenskapen kan ändras i befintliga fält. Om du aktiverar den här egenskapen ökar inte kraven på indexlagring. Standardvärdet är true för enkla fält, false för vektorfält och null för komplexa fält.

searchAnalyzer

LexicalAnalyzerName

Namnet på analysatorn som användes vid söktillfället för fältet. Det här alternativet kan endast användas med sökbara fält. Den måste anges tillsammans med indexAnalyzer och den kan inte anges tillsammans med analyzer-alternativet. Den här egenskapen kan inte anges till namnet på en språkanalysator. använd egenskapen analyzer i stället om du behöver en språkanalysator. Den här analysatorn kan uppdateras i ett befintligt fält. Måste vara null för komplexa fält.

searchable

boolean

Ett värde som anger om fältet kan sökas i fulltext. Det innebär att den kommer att genomgå en analys, till exempel ordbrytning under indexeringen. Om du anger ett sökbart fält till ett värde som "solig dag" delas det internt upp i de enskilda tokensna "sunny" och "day". Detta möjliggör fulltextsökningar för dessa termer. Fält av typen Edm.String eller Collection(Edm.String) kan sökas som standard. Den här egenskapen måste vara false för enkla fält av andra datatyper som inte är strängar, och den måste vara null för komplexa fält. Obs! Sökbara fält förbrukar extra utrymme i indexet för att hantera ytterligare tokeniserade versioner av fältvärdet för fulltextsökningar. Om du vill spara utrymme i indexet och du inte behöver ett fält som ska inkluderas i sökningar anger du sökbart till false.

sortable

boolean

Ett värde som anger om fältet ska refereras till i $orderby uttryck. Som standard sorterar sökmotorn resultat efter poäng, men i många upplevelser vill användarna sortera efter fält i dokumenten. Ett enkelt fält kan bara sorteras om det är envärdesvärde (det har ett enda värde i omfånget för det överordnade dokumentet). Enkla samlingsfält kan inte sorteras eftersom de är flervärdesfält. Enkla underfält i komplexa samlingar är också flervärdesfält och kan därför inte sorteras. Detta gäller oavsett om det är ett omedelbart överordnat fält eller ett förfader fält, som är den komplexa kollektionen. Komplexa fält kan inte sorteras och egenskapen sortable måste vara null för sådana fält. Standardvärdet för sorterbar är true för enkla fält med ett värde, false för enkla fält med flera värden och null för komplexa fält.

stored

boolean

Ett oföränderligt värde som anger om fältet ska sparas separat på disken som ska returneras i ett sökresultat. Du kan inaktivera det här alternativet om du inte planerar att returnera fältinnehållet i ett söksvar för att spara på lagringskostnaderna. Detta kan bara anges när index skapas och endast för vektorfält. Det går inte att ändra den här egenskapen för befintliga fält eller anges som false för nya fält. Om den här egenskapen är inställd på false måste egenskapen "retrievable" också anges till false. Den här egenskapen måste vara true eller unset för nyckelfält, för nya fält och för icke-vektorfält, och den måste vara null för komplexa fält. Om du inaktiverar den här egenskapen minskar kraven på indexlagring. Standardvärdet gäller för vektorfält.

synonymMaps

string[]

En lista över namnen på synonymkartor som ska associeras med det här fältet. Det här alternativet kan endast användas med sökbara fält. För närvarande stöds endast en synonymkarta per fält. Om du tilldelar en synonymkarta till ett fält ser du till att frågetermer som riktar sig mot det fältet expanderas vid frågetillfället med hjälp av reglerna i synonymkartan. Det här attributet kan ändras i befintliga fält. Måste vara null eller en tom samling för komplexa fält.

type

SearchFieldDataType

Datatypen för fältet.

vectorEncoding

VectorEncodingFormat

Kodningsformatet för att tolka fältinnehållet.

vectorSearchProfile

string

Namnet på vektorsökningsprofilen som anger algoritmen och vektoriseraren som ska användas vid sökning i vektorfältet.

SearchFieldDataType

Definierar datatypen för ett fält i ett sökindex.

Värde Description
Edm.String

Anger att ett fält innehåller en sträng.

Edm.Int32

Anger att ett fält innehåller ett 32-bitars signerat heltal.

Edm.Int64

Anger att ett fält innehåller ett 64-bitars signerat heltal.

Edm.Double

Anger att ett fält innehåller ett IEEE-flyttal med dubbel precision.

Edm.Boolean

Anger att ett fält innehåller ett booleskt värde (sant eller falskt).

Edm.DateTimeOffset

Anger att ett fält innehåller ett datum-/tidsvärde, inklusive tidszonsinformation.

Edm.GeographyPoint

Anger att ett fält innehåller en geo-plats när det gäller longitud och latitud.

Edm.ComplexType

Anger att ett fält innehåller ett eller flera komplexa objekt som i sin tur har underfält av andra typer.

Edm.Single

Anger att ett fält innehåller ett flyttal med enkel precision. Detta är endast giltigt när det används med Collection(Edm.Single).

Edm.Half

Anger att ett fält innehåller ett flyttal med halv precision. Detta är endast giltigt när det används med Collection(Edm.Half).

Edm.Int16

Anger att ett fält innehåller ett 16-bitars signerat heltal. Detta är endast giltigt när det används med Collection(Edm.Int16).

Edm.SByte

Anger att ett fält innehåller ett 8-bitars signerat heltal. Detta är endast giltigt när det används med Collection(Edm.SByte).

Edm.Byte

Anger att ett fält innehåller ett 8-bitars osignerat heltal. Detta är endast giltigt när det används med Collection(Edm.Byte).

SearchIndex

Representerar en sökindexdefinition som beskriver fälten och sökbeteendet för ett index.

Name Typ Description
@odata.etag

string

Indexets ETag.

analyzers LexicalAnalyzer[]:

Analysverktygen för indexet.

charFilters CharFilter[]:

Tecknet filtrerar för indexet.

corsOptions

CorsOptions

Alternativ för att styra CORS (Cross-Origin Resource Sharing) för indexet.

defaultScoringProfile

string

Namnet på bedömningsprofilen som ska användas om ingen anges i frågan. Om den här egenskapen inte har angetts och ingen bedömningsprofil har angetts i frågan används standardbedömning (tf-idf).

description

string

En beskrivning av indexet.

encryptionKey

SearchResourceEncryptionKey

En beskrivning av en krypteringsnyckel som du skapar i Azure Key Vault. Denna nyckel används för att ge en extra nivå av kryptering i vila för dina data när du vill ha full säkerhet att ingen, inte ens Microsoft, kan dekryptera dina data. När du har krypterat dina data förblir de alltid krypterade. Söktjänsten ignorerar försök att ange den här egenskapen till null. Du kan ändra den här egenskapen efter behov om du vill rotera krypteringsnyckeln. Dina data påverkas inte. Kryptering med kundhanterade nycklar är inte tillgängligt för kostnadsfria söktjänster och är endast tillgängligt för betaltjänster som skapats den 1 januari 2019 eller senare.

fields

SearchField[]

Fälten i indexet.

name

string

Namnet på indexet.

normalizers LexicalNormalizer[]:

CustomNormalizer[]

Normaliserare för indexet.

scoringProfiles

ScoringProfile[]

Bedömningsprofilerna för indexet.

semantic

SemanticSearch

Definierar parametrar för ett sökindex som påverkar semantiska funktioner.

similarity SimilarityAlgorithm:

Typen av likhetsalgoritm som ska användas vid bedömning och rangordning av dokument som matchar en sökfråga. Likhetsalgoritmen kan bara definieras när index skapas och kan inte ändras på befintliga index. Om värdet är null används ClassicSimilarity-algoritmen.

suggesters

SearchSuggester[]

Förslagsgivare för indexet.

tokenFilters TokenFilter[]:

Tokenfiltren för indexet.

tokenizers LexicalTokenizer[]:

Tokenizers för indexet.

vectorSearch

VectorSearch

Innehåller konfigurationsalternativ som rör vektorsökning.

SearchIndexerDataNoneIdentity

Rensar identitetsegenskapen för en datakälla.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.DataNoneIdentity

Ett URI-fragment som anger typen av identitet.

SearchIndexerDataUserAssignedIdentity

Anger identiteten för en datakälla som ska användas.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.DataUserAssignedIdentity

Ett URI-fragment som anger typen av identitet.

userAssignedIdentity

string

Det fullständigt kvalificerade Azure-resurs-ID:t för en användartilldelad hanterad identitet, vanligtvis i formuläret "/subscriptions/12345678-1234-1234-1234567890ab/resourceGroups/rg/providers/Microsoft.ManagedIdentity/userAssignedIdentities/myId" som borde ha tilldelats söktjänsten.

SearchResourceEncryptionKey

En kundhanterad krypteringsnyckel i Azure Key Vault. Nycklar som du skapar och hanterar kan användas för att kryptera eller dekryptera vilande data, till exempel index och synonymmappningar.

Name Typ Description
accessCredentials.applicationId

string

Ett AAD-program-ID som har beviljats nödvändiga åtkomstbehörigheter till Azure Key Vault som ska användas när du krypterar dina data i vila. Program-ID:t bör inte förväxlas med objekt-ID:t för ditt AAD-program.

accessCredentials.applicationSecret

string

Autentiseringsnyckeln för det angivna AAD-programmet.

identity SearchIndexerDataIdentity:

En explicit hanterad identitet som ska användas för den här krypteringsnyckeln. Om det inte anges och egenskapen för åtkomstautentiseringsuppgifter är null används den systemtilldelade hanterade identiteten. Om den explicita identiteten är ospecificerad vid uppdatering av resursen förblir den oförändrad. Om "ingen" anges rensas värdet för den här egenskapen.

keyVaultKeyName

string

Namnet på din Azure Key Vault-nyckel som ska användas för att kryptera dina vilande data.

keyVaultKeyVersion

string

Den version av Azure Key Vault-nyckeln som ska användas för att kryptera dina vilande data.

keyVaultUri

string

URI:n för ditt Azure Key Vault, även kallat DNS-namn, som innehåller nyckeln som ska användas för att kryptera dina data i vila. Ett exempel på en URI kan vara https://my-keyvault-name.vault.azure.net.

SearchSuggester

Definierar hur Api för förslag ska tillämpas på en grupp fält i indexet.

Name Typ Description
name

string

Namnet på förslagsställaren.

searchMode enum:

analyzingInfixMatching

Ett värde som anger förslagsställarens funktioner.

sourceFields

string[]

Listan över fältnamn som förslagsställaren gäller för. Varje fält måste vara sökbart.

SemanticConfiguration

Definierar en specifik konfiguration som ska användas i samband med semantiska funktioner.

Name Typ Description
name

string

Namnet på den semantiska konfigurationen.

prioritizedFields

SemanticPrioritizedFields

Beskriver de rubrik-, innehålls- och nyckelordsfält som ska användas för semantisk rangordning, undertexter, markeringar och svar. Minst en av de tre underegenskaperna (titleField, prioritizedKeywordsFields och prioritizedContentFields) måste anges.

rankingOrder

RankingOrder

Anger vilken poängtyp som ska användas för sökresultatens sorteringsordning.

SemanticField

Ett fält som används som en del av den semantiska konfigurationen.

Name Typ Description
fieldName

string

Filnamn

SemanticPrioritizedFields

Beskriver fälten rubrik, innehåll och nyckelord som ska användas för semantisk rangordning, undertexter, markeringar och svar.

Name Typ Description
prioritizedContentFields

SemanticField[]

Definierar de innehållsfält som ska användas för semantisk rangordning, undertexter, höjdpunkter och svar. För bästa resultat bör de markerade fälten innehålla text i naturlig språkform. Ordningen på fälten i matrisen representerar deras prioritet. Fält med lägre prioritet kan trunkeras om innehållet är långt.

prioritizedKeywordsFields

SemanticField[]

Definierar de nyckelordsfält som ska användas för semantisk rangordning, bildtexter, höjdpunkter och svar. För bästa resultat bör de markerade fälten innehålla en lista med nyckelord. Ordningen på fälten i matrisen representerar deras prioritet. Fält med lägre prioritet kan trunkeras om innehållet är långt.

titleField

SemanticField

Definierar titelfältet som ska användas för semantisk rangordning, bildtexter, markeringar och svar. Om du inte har något titelfält i indexet lämnar du det tomt.

SemanticSearch

Definierar parametrar för ett sökindex som påverkar semantiska funktioner.

Name Typ Description
configurations

SemanticConfiguration[]

De semantiska konfigurationerna för indexet.

defaultConfiguration

string

Gör att du kan ange namnet på en semantisk standardkonfiguration i ditt index, vilket gör det valfritt att skicka den vidare som en frågeparameter varje gång.

ShingleTokenFilter

Skapar kombinationer av tokens till en enda token. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.ShingleTokenFilter

Diskrimineringen för härledda typer.

filterToken

string

_

Strängen som ska infogas för varje position där det inte finns någon token. Standardvärdet är ett understreck ("_").

maxShingleSize

integer (int32)

minimum: 2
2

Den maximala bältrosstorleken. Standardvärdet och minimivärdet är 2.

minShingleSize

integer (int32)

minimum: 2
2

Minsta bältrosstorlek. Standardvärdet och minimivärdet är 2. Måste vara mindre än värdet för maxShingleSize.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

outputUnigrams

boolean

True

Ett värde som anger om utdataströmmen ska innehålla indatatoken (unigram) samt bältros. Standardvärdet är sant.

outputUnigramsIfNoShingles

boolean

False

Ett värde som anger om unigram ska matas ut för de tider då inga bältros är tillgängliga. Den här egenskapen har företräde när outputUnigrams är inställt på false. Standardvärdet är false.

tokenSeparator

string

Strängen som ska användas när du ansluter intilliggande token för att bilda en bältros. Standardvärdet är ett enda blanksteg (" ").

SnowballTokenFilter

Ett filter som stjälkar ord med hjälp av en Snowball-genererad stemmer. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.SnowballTokenFilter

Diskrimineringen för härledda typer.

language

SnowballTokenFilterLanguage

Språket som ska användas.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

SnowballTokenFilterLanguage

Det språk som ska användas för ett Snowball-tokenfilter.

Värde Description
armenian

Väljer Lucene Snowball stemming tokenizer för armeniska.

basque

Väljer Lucene Snowball stemming tokenizer för baskiska.

catalan

Väljer Lucene Snowball stemming tokenizer för katalanska.

danish

Väljer Lucene Snowball stemming tokenizer för danska.

dutch

Väljer Lucene Snowball stemming tokenizer för nederländska.

english

Väljer Lucene Snowball stemming tokenizer för engelska.

finnish

Väljer Lucene Snowball stemming tokenizer för finska.

french

Väljer Lucene Snowball stemming tokenizer för franska.

german

Väljer Lucene Snowball stemming tokenizer för tyska.

german2

Väljer den Lucene Snowball-tokeniserare som använder den tyska variantalgoritmen.

hungarian

Väljer Lucene Snowball stemming tokenizer för ungerska.

italian

Väljer Lucene Snowball stemming tokenizer för italienska.

kp

Väljer Lucene Snowball-tokeniseraren för nederländare som använder algoritmen för Kraaij-Pohlmann härstamning.

lovins

Väljer Lucene Snowball-tokeniseraren för engelsk stamning som använder Lovins algoritm för ordstamning.

norwegian

Väljer Lucene Snowball-tokeniseraren för att härstamma från Norwegian.

porter

Väljer Lucene Snowball stemming tokenizer för engelska som använder Porter stemming-algoritmen.

portuguese

Väljer Lucene Snowball stemming tokenizer för portugisiska.

romanian

Väljer Lucene Snowball stemming tokenizer för rumänska.

russian

Väljer Lucene Snowball stemming tokenizer för ryska.

spanish

Väljer Lucene Snowball stemming tokenizer för spanska.

swedish

Väljer Lucene Snowball stemming tokenizer för svenska.

turkish

Väljer Lucene Snowball-stammens tokenizer för turkiska.

StemmerOverrideTokenFilter

Ger möjlighet att åsidosätta andra härdningsfilter med anpassad ordlistebaserad härdning. Ordlisteskaftade termer markeras som nyckelord så att de inte kommer att stoppas med stemmers längre ned i kedjan. Måste placeras före eventuella härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/StemmerOverrideFilter.html

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.StemmerOverrideTokenFilter

Diskrimineringen för härledda typer.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

rules

string[]

En lista över härstamningsregler i följande format: "word => stem", till exempel: "ran => run".

StemmerTokenFilter

Språkspecifikt härdningsfilter. Det här tokenfiltret implementeras med Apache Lucene. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.StemmerTokenFilter

Diskrimineringen för härledda typer.

language

StemmerTokenFilterLanguage

Språket som ska användas.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

StemmerTokenFilterLanguage

Det språk som ska användas för ett stemmer-tokenfilter.

Värde Description
arabic

Väljer Lucene-tokeniseraren för avstamning för arabiska.

armenian

Väljer Lucene-stammens tokenizer för armeniska.

basque

Väljer Lucene-tokeniseraren för avstamning för baskiska.

brazilian

Väljer Lucene-tokeniseraren för avstamning för portugisiska (Brasilien).

bulgarian

Väljer Lucene-stammens tokenizer för bulgariska.

catalan

Väljer Lucene-tokeniseraren för härstamning för katalanska.

czech

Väljer Lucene-tokeniseraren för avstamning för tjeckiska.

danish

Väljer Lucene-tokeniseraren för avstamning för danska.

dutch

Väljer Lucene-tokeniseraren för avstamning för nederländska.

dutchKp

Väljer Lucene-tokeniseraren för ordstamsigenkänning för nederländska som använder algoritmen för Kraaij-Pohlmann härstamning.

english

Väljer Lucene-tokeniseraren för avstamning på engelska.

lightEnglish

Väljer Lucene-tokeniseraren för härstamning för engelska som gör lätt stamning.

minimalEnglish

Väljer Lucene stemming-tokeniserare för engelska som gör minimal stemming.

possessiveEnglish

Väljer Lucene-stammens tokenizer för engelska som tar bort avslutande possessiv från ord.

porter2

Väljer Lucene-tokeniseraren för ordstamsigenkänning för engelska som använder algoritmen för ordstamsigenkänning Porter2.

lovins

Väljer Lucene-tokeniseraren för ordstamsigenkänning för engelska som använder algoritmen för Lovins härstamning.

finnish

Väljer Lucene-tokeniseraren för härstamning för finska.

lightFinnish

Väljer Lucene-tokeniseraren för ordstamsigenkänning för finska som gör lätt stamning.

french

Väljer Lucene-tokeniseraren för avstamning för franska.

lightFrench

Väljer Lucene-tokeniseraren för härstamning för franska som gör lätt stamning.

minimalFrench

Väljer Lucene-tokeniseraren för avstamning för franska som utför minimal härstamning.

galician

Väljer Lucene-stammens tokenizer för galiciska.

minimalGalician

Väljer Lucene-tokeniseraren för härstamning för galiciska som gör minimal härstamning.

german

Väljer Lucene-tokeniseraren för avstamning för tyska.

german2

Väljer den Lucene-stammande tokeniserare som använder den tyska variantalgoritmen.

lightGerman

Väljer Lucene-tokeniseraren för ordstamsigenkänning för tyska som gör lätt stamning.

minimalGerman

Väljer Lucene-tokeniseraren för härstamning för tyska som gör minimal härstamning.

greek

Väljer Lucene-stammens tokenizer för grekiska.

hindi

Väljer Lucene-tokeniseraren för avstamning för hindi.

hungarian

Väljer Lucene-stammens tokenizer för ungerska.

lightHungarian

Väljer Lucene-tokeniseraren för stamning för ungerska som gör lätt stamning.

indonesian

Väljer Lucene-stammens tokenizer för indonesiska.

irish

Väljer Lucene-tokeniseraren för härstamning för irländska.

italian

Väljer Lucene-tokeniseraren för härstamning för italienska.

lightItalian

Väljer Lucene-tokeniseraren för härstamning för italienska som gör lätt stamning.

sorani

Väljer Lucene-tokeniseraren för avstamning för Sorani.

latvian

Väljer Lucene-tokeniseraren för avstamning för lettiska.

norwegian

Väljer Lucene stemming-tokenizern för norska (Bokmül).

lightNorwegian

Väljer Lucene stemming-tokenizern för Norwegian (Bokmál) som gör lätt stemming.

minimalNorwegian

Väljer Lucene stemming-tokenizern för Norwegian (Bokmül) som gör minimal stemming.

lightNynorsk

Väljer Lucene-tokeniseraren för härstamning för norska (nynorsk) som gör lätt stamning.

minimalNynorsk

Väljer Lucene-tokeniseraren för härstamning för norska (nynorsk) som gör minimal härstamning.

portuguese

Väljer Lucene-tokeniseraren för avstamning för portugisiska.

lightPortuguese

Väljer Lucene-tokeniseraren för ordstamsigenkänning för portugisiska som gör lätt stamning.

minimalPortuguese

Väljer Lucene stemming-tokenizer för portugisiska som gör minimal stamning.

portugueseRslp

Väljer Lucene-tokeniseraren för ordstamsigenkänning för portugisiska som använder RSLP-algoritmen för härstamning.

romanian

Väljer Lucene-stammens tokenizer för rumänska.

russian

Väljer Lucene-stammens tokenizer för ryska.

lightRussian

Väljer Lucene-stammens tokenizer för ryska som gör lätt stamning.

spanish

Väljer Lucene-tokeniseraren för avstamning för spanska.

lightSpanish

Väljer Lucene-tokeniseraren för stamning för spanska som gör lätt stamning.

swedish

Väljer Lucene-stammens tokenizer för svenska.

lightSwedish

Väljer Lucene stemming tokenizer för svenska som gör light stemming.

turkish

Väljer Lucene-stammens tokenizer för turkiska.

StopAnalyzer

Delar upp text med icke-bokstäver; Tillämpar filter för gemener och stoppordstoken. Den här analysatorn implementeras med Apache Lucene.

Name Typ Description
@odata.type string:

#Microsoft.Azure.Search.StopAnalyzer

Diskrimineringen för härledda typer.

name

string

Namnet på analysatorn. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

stopwords

string[]

En lista över stoppord.

StopwordsList

Identifierar en fördefinierad lista med språkspecifika stoppord.

Värde Description
arabic

Markerar stoppordslistan för arabiska.

armenian

Markerar stoppordslistan för armeniska.

basque

Markerar stoppordslistan för baskiska.

brazilian

Markerar stoppordslistan för portugisiska (Brasilien).

bulgarian

Markerar stoppordslistan för bulgariska.

catalan

Markerar stoppordslistan för katalanska.

czech

Markerar stoppordslistan för tjeckiska.

danish

Markerar stoppordslistan för danska.

dutch

Markerar stoppordslistan för nederländska.

english

Väljer stoppordslista för engelska.

finnish

Markerar stoppordslistan för finska.

french

Väljer stoppordslistan för franska.

galician

Markerar stoppordslistan för galiciska.

german

Väljer stoppordslistan för tyska.

greek

Markerar stoppordslistan för grekiska.

hindi

Markerar stoppordslistan för hindi.

hungarian

Markerar stoppordslistan för ungerska.

indonesian

Väljer stoppordslista för indonesiska.

irish

Väljer stoppordslistan för iriska.

italian

Markerar stoppordslistan för italienska.

latvian

Markerar stoppordslistan för lettiska.

norwegian

Markerar stoppordslistan för norska.

persian

Markerar stoppordslistan för persiska.

portuguese

Markerar stoppordslistan för portugisiska.

romanian

Markerar stoppordslistan för rumänska.

russian

Väljer stoppordslistan för ryska.

sorani

Markerar stoppordslistan för Sorani.

spanish

Väljer stoppordslistan för spanska.

swedish

Markerar stoppordslistan för svenskan.

thai

Markerar stoppordslistan för thailändska.

turkish

Markerar stoppordslistan för turkiska.

StopwordsTokenFilter

Tar bort stoppord från en tokenström. Det här tokenfiltret implementeras med Apache Lucene. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.StopwordsTokenFilter

Diskrimineringen för härledda typer.

ignoreCase

boolean

False

Ett värde som anger om skiftläge ska ignoreras. Om sant konverteras alla ord till gemener först. Standardvärdet är false.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

removeTrailing

boolean

True

Ett värde som anger om den sista söktermen ska ignoreras om det är ett stoppord. Standardvärdet är sant.

stopwords

string[]

Listan över stoppord. Både den här egenskapen och stopwords-listegenskapen kan inte anges.

stopwordsList

StopwordsList

english

En fördefinierad lista över stoppord som ska användas. Både den här egenskapen och stopwords-egenskapen kan inte anges. Standardvärdet är engelska.

SynonymTokenFilter

Matchar synonymer med en eller flera ord i en tokenström. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.SynonymTokenFilter

Diskrimineringen för härledda typer.

expand

boolean

True

Ett värde som anger om alla ord i listan med synonymer (om => notation inte används) mappas till varandra. Om sant mappas alla ord i listan med synonymer (om => notation inte används) till varandra. Följande lista: otroligt, otroligt, fantastiskt, fantastiskt motsvarar: otroligt, otroligt, fantastiskt, fantastiskt => otroligt, otroligt, fantastiskt, fantastiskt. Om det är falskt, kommer följande lista: otrolig, otrolig, fantastisk, fantastisk att motsvara: otrolig, otrolig, fantastisk, fantastisk => otrolig. Standardvärdet är sant.

ignoreCase

boolean

False

Ett värde som anger om indata för skiftläge ska vikas för matchning. Standardvärdet är false.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

synonyms

string[]

En lista över synonymer i följande två format: 1. otroligt, otroligt, fantastiskt => fantastiskt - alla termer på vänster sida av => symbolen kommer att ersättas med alla termer på höger sida; 2. otroligt, otroligt, fantastiskt, fantastiskt - kommaavgränsad lista över motsvarande ord. Ange alternativet expandera för att ändra hur den här listan tolkas.

TagScoringFunction

Definierar en funktion som ökar antalet dokument med strängvärden som matchar en viss lista med taggar.

Name Typ Description
boost

number (double)

En multiplikator för råpoängen. Måste vara ett positivt tal som inte är lika med 1,0.

fieldName

string

Namnet på fältet som används som indata till bedömningsfunktionen.

interpolation

ScoringFunctionInterpolation

Ett värde som anger hur ökning kommer att interpoleras mellan dokumentpoäng. standardvärdet "Linjär".

tag

TagScoringParameters

Parametervärden för taggbedömningsfunktionen.

type string:

tag

Typ av poängfunktion.

TagScoringParameters

Ger parametervärden till en taggbedömningsfunktion.

Name Typ Description
tagsParameter

string

Namnet på parametern som skickas i sökfrågor för att ange listan med taggar som ska jämföras med målfältet.

TextWeights

Definierar vikter för indexfält för vilka matchningar ska öka poängsättningen i sökfrågor.

Name Typ Description
weights

object

Ordlistan med vikter per fält för att öka dokumentpoängsättningen. Nycklarna är fältnamn och värdena är vikterna för varje fält.

TokenCharacterKind

Representerar klasser av tecken som ett tokenfilter kan användas på.

Värde Description
letter

Behåller bokstäver i tokens.

digit

Behåller siffror i tokens.

whitespace

Behåller blanksteg i tokens.

punctuation

Behåller skiljetecken i token.

symbol

Behåller symboler i tokens.

TokenFilterName

Definierar namnen på alla tokenfilter som stöds av sökmotorn.

Värde Description
arabic_normalization

Ett tokenfilter som tillämpar den arabiska normaliseraren för att normalisera ortografin. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ar/ArabicNormalizationFilter.html

apostrophe

Tar bort alla tecken efter en apostrofer (inklusive själva apostrofen). Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/tr/ApostropheFilter.html

asciifolding

Konverterar alfabetiska, numeriska och symboliska Unicode-tecken som inte finns i de första 127 ASCII-tecknen (unicode-blocket basic latin) till deras ASCII-motsvarigheter, om sådana motsvarigheter finns. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ASCIIFoldingFilter.html

cjk_bigram

Bildar bigrams av CJK-termer som genereras från standardtokeniseraren. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKBigramFilter.html

cjk_width

Normaliserar skillnader i CJK-bredd. Viker fullbreddsvarianter av ASCII till motsvarande grundläggande latin, och halvbreddsvarianter av Katakana till motsvarande Kana. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/cjk/CJKWidthFilter.html

classic

Tar bort engelska possessives och punkter från förkortningar. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/standard/ClassicFilter.html

common_grams

Skapa bigrams för ofta förekommande termer vid indexering. Enkla termer indexeras också, med bigrams överlagrade. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/commongrams/CommonGramsFilter.html

edgeNGram_v2

Genererar n-gram av de angivna storlekarna med början framifrån eller på baksidan av en indatatoken. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/EdgeNGramTokenFilter.html

elision

Tar bort elisions. Till exempel konverteras "l'avion" (planet) till "avion" (plan). Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/util/ElisionFilter.html

german_normalization

Normaliserar tyska tecken enligt heuristiken i den tyska algoritmen för snöboll. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/de/GermanNormalizationFilter.html

hindi_normalization

Normaliserar text på hindi för att ta bort vissa skillnader i stavningsvariationer. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/hi/HindiNormalizationFilter.html

indic_normalization

Normaliserar Unicode-representationen av text på indiska språk. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/in/IndicNormalizationFilter.html

keyword_repeat

Genererar varje inkommande token två gånger, en gång som nyckelord och en gång som icke-nyckelord. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/KeywordRepeatFilter.html

kstem

Ett högpresterande kstem-filter för engelska. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/en/KStemFilter.html

length

Tar bort ord som är för långa eller för korta. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LengthFilter.html

limit

Begränsar antalet token vid indexering. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/LimitTokenCountFilter.html

lowercase

Normaliserar tokentext till gemener. Se https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/LowerCaseFilter.html

nGram_v2

Genererar n-gram av de angivna storlekarna. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ngram/NGramTokenFilter.html

persian_normalization

Tillämpar normalisering för persiska. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/fa/PersianNormalizationFilter.html

phonetic

Skapa token för fonetiska matchningar. Se https://lucene.apache.org/core/4_10_3/analyzers-phonetic/org/apache/lucene/analysis/phonetic/package-tree.html

porter_stem

Använder Porter-algoritmen för att transformera tokenströmmen. Se http://tartarus.org/~martin/PorterStemmer

reverse

Återställer tokensträngen. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/reverse/ReverseStringFilter.html

scandinavian_normalization

Normaliserar användningen av utbytbara skandinaviska tecken. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianNormalizationFilter.html

scandinavian_folding

Viker skandinaviska tecken Ã¥Á... äæÃ"Ã"ƶççã"öçëöççãƒ>->ã¶Ã¶Ã� Det diskriminerar också användningen av dubbla vokaler aa, ae, ao, oe och oo, vilket bara lämnar den första. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/ScandinavianFoldingFilter.html

shingle

Skapar kombinationer av tokens till en enda token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/shingle/ShingleFilter.html

snowball

Ett filter som stjälkar ord med hjälp av en Snowball-genererad stemmer. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/snowball/SnowballFilter.html

sorani_normalization

Normaliserar Unicode-representationen av Sorani-text. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/ckb/SoraniNormalizationFilter.html

stemmer

Språkspecifikt härdningsfilter. Se https://dotnet.territoriali.olinfo.it/rest/api/searchservice/Custom-analyzers-in-Azure-Search#TokenFilters

stopwords

Tar bort stoppord från en tokenström. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/core/StopFilter.html

trim

Trimmar inledande och avslutande blanksteg från token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TrimFilter.html

truncate

Trunkerar termerna till en viss längd. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/TruncateTokenFilter.html

unique

Filtrerar bort token med samma text som föregående token. Se http://lucene.apache.org/core/4_10_3/analyzers-common/org/apache/lucene/analysis/miscellaneous/RemoveDuplicatesTokenFilter.html

uppercase

Normaliserar tokentexten till stora bokstäver. Se https://lucene.apache.org/core/6_6_1/analyzers-common/org/apache/lucene/analysis/core/UpperCaseFilter.html

word_delimiter

Delar upp ord i underord och utför valfria transformeringar i underordsgrupper.

TruncateTokenFilter

Trunkerar termerna till en viss längd. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.TruncateTokenFilter

Diskrimineringen för härledda typer.

length

integer (int32)

maximum: 300
300

Längden som termerna ska trunkeras med. Standard och max är 300.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

UaxUrlEmailTokenizer

Tokeniserar URL:er och e-postmeddelanden som en token. Den här tokenizern implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.UaxUrlEmailTokenizer

Diskrimineringen för härledda typer.

maxTokenLength

integer (int32)

maximum: 300
255

Maximal tokenlängd. Standardvärdet är 255. Token som är längre än den maximala längden delas upp. Den maximala tokenlängden som kan användas är 300 tecken.

name

string

Namnet på tokenizern. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

UniqueTokenFilter

Filtrerar bort token med samma text som föregående token. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.UniqueTokenFilter

Diskrimineringen för härledda typer.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

onlyOnSamePosition

boolean

False

Ett värde som anger om du bara vill ta bort dubbletter på samma position. Standardvärdet är false.

VectorEncodingFormat

Kodningsformatet för tolkning av vektorfältinnehåll.

Värde Description
packedBit

Kodningsformat som representerar bitar som är packade i en bredare datatyp.

VectorSearch

Innehåller konfigurationsalternativ som rör vektorsökning.

Name Typ Description
algorithms VectorSearchAlgorithmConfiguration[]:

Innehåller konfigurationsalternativ som är specifika för den algoritm som används under indexering eller frågor.

compressions VectorSearchCompression[]:

Innehåller konfigurationsalternativ som är specifika för komprimeringsmetoden som används vid indexering eller frågor.

profiles

VectorSearchProfile[]

Definierar kombinationer av konfigurationer som ska användas med vektorsökning.

vectorizers VectorSearchVectorizer[]:

Innehåller konfigurationsalternativ för hur du vektoriserar textvektorfrågor.

VectorSearchAlgorithmKind

Algoritmen som används för indexering och frågor.

Värde Description
hnsw

HNSW (Hierarchical Navigable Small World), en typ av ungefärlig närmaste grannalgoritm.

exhaustiveKnn

Fullständig KNN-algoritm som utför brute-force-sökning.

VectorSearchAlgorithmMetric

Likhetsmåttet som ska användas för vektorjämförelser. Vi rekommenderar att du väljer samma likhetsmått som inbäddningsmodellen tränades på.

Värde Description
cosine

Mäter vinkeln mellan vektorer för att kvantifiera deras likhet och bortse från omfattningen. Ju mindre vinkel, desto närmare likhet.

euclidean

Beräknar det raka avståndet mellan vektorer i ett flerdimensionellt utrymme. Ju mindre avstånd, desto närmare likhet.

dotProduct

Beräknar summan av elementbaserade produkter för att mäta justering och storlekslikhet. Ju större och mer positiv, desto närmare likhet.

hamming

Gäller endast för bitpackade binära datatyper. Avgör olikhet genom att räkna olika positioner i binära vektorer. Ju färre skillnader, desto närmare likhet.

VectorSearchCompressionKind

Den komprimeringsmetod som används för indexering och frågor.

Värde Description
scalarQuantization

Scalar Quantization, en typ av komprimeringsmetod. I skalär kvantisering komprimeras de ursprungliga vektorvärdena till en smalare typ genom att diskretisera och representera varje komponent i en vektor med hjälp av en reducerad uppsättning kvantiserade värden, vilket minskar den totala datastorleken.

binaryQuantization

Binär kvantisering, en typ av komprimeringsmetod. I binär kvantisering komprimeras de ursprungliga vektorvärdena till den smalare binära typen genom att diskretisera och representera varje komponent i en vektor med binära värden, vilket minskar den totala datastorleken.

VectorSearchCompressionTarget

Den kvantiserade datatypen för komprimerade vektorvärden.

Värde Description
int8

8-bitars signerat heltal.

VectorSearchProfile

Definierar en kombination av konfigurationer som ska användas med vektorsökning.

Name Typ Description
algorithm

string

Namnet på konfigurationen av vektorsökningsalgoritmen som anger algoritmen och valfria parametrar.

compression

string

Namnet på konfigurationen av komprimeringsmetoden som anger komprimeringsmetoden och valfria parametrar.

name

string

Namnet som ska associeras med den här vektorsökningsprofilen.

vectorizer

string

Namnet på vektoriseringen som konfigureras för användning med vektorsökning.

VectorSearchVectorizerKind

Den vektoriseringsmetod som ska användas under frågetiden.

Värde Description
azureOpenAI

Generera inbäddningar med hjälp av en Azure OpenAI-resurs vid frågetillfället.

customWebApi

Generera inbäddningar med hjälp av en anpassad webbslutpunkt vid frågetillfället.

aiServicesVision

Generera inbäddningar för en bild eller textinmatning vid frågetillfället med hjälp av Azure AI Services Vision Vectorize-API:et.

aml

Generera inbäddningar med hjälp av en Azure Machine Learning-slutpunkt som distribueras via Azure AI Foundry Model Catalog vid frågetillfället.

WebApiVectorizer

Anger en användardefinierad vektoriserare för att generera vektorbäddning av en frågesträng. Integrering av en extern vektoriserare uppnås med hjälp av det anpassade webb-API-gränssnittet för en kompetensuppsättning.

Name Typ Description
customWebApiParameters

WebApiVectorizerParameters

Anger egenskaperna för den användardefinierade vektoriseraren.

kind string:

customWebApi

Typ av VectorSearchVectorizer.

name

string

Namnet som ska associeras med den här specifika vektoriseringsmetoden.

WebApiVectorizerParameters

Anger egenskaperna för att ansluta till en användardefinierad vektoriserare.

Name Typ Description
authIdentity SearchIndexerDataIdentity:

Den användartilldelade hanterade identiteten som används för utgående anslutningar. Om ett authResourceId har angetts och det inte har angetts används den systemtilldelade hanterade identiteten. Vid uppdateringar av indexeraren, om identiteten är ospecificerad, förblir värdet oförändrat. Om värdet är "none" rensas värdet för den här egenskapen.

authResourceId

string

Gäller anpassade endpoints som ansluter till extern kod i en Azure-funktion eller någon annan applikation som tillhandahåller transformationerna. Det här värdet ska vara det program-ID som skapades för funktionen eller appen när den registrerades med Azure Active Directory. När det anges ansluter vektoriseringen till funktionen eller appen med hjälp av ett hanterat ID (antingen system eller användartilldelat) för söktjänsten och åtkomsttoken för funktionen eller appen, med hjälp av det här värdet som resurs-ID för att skapa omfånget för åtkomsttoken.

httpHeaders

object

De huvuden som krävs för att göra HTTP-begäran.

httpMethod

string

Metoden för HTTP-begäran.

timeout

string (duration)

Önskad timeout för begäran. Standardvärdet är 30 sekunder.

uri

string (uri)

URI:n för webb-API:et som tillhandahåller vektoriseraren.

WordDelimiterTokenFilter

Delar upp ord i underord och utför valfria transformeringar i underordsgrupper. Det här tokenfiltret implementeras med Apache Lucene.

Name Typ Standardvärde Description
@odata.type string:

#Microsoft.Azure.Search.WordDelimiterTokenFilter

Diskrimineringen för härledda typer.

catenateAll

boolean

False

Ett värde som anger om alla underordsdelar ska kategoriseras. Om detta till exempel är inställt på sant blir "Azure-Search-1" "AzureSearch1". Standardvärdet är false.

catenateNumbers

boolean

False

Ett värde som anger om maximala körningar av antal delar ska kategoriseras. Om detta till exempel är inställt på sant blir "1–2" "12". Standardvärdet är false.

catenateWords

boolean

False

Ett värde som anger om maximala körningar av orddelar ska kategoriseras. Om detta till exempel är inställt på sant blir "Azure-Search" "AzureSearch". Standardvärdet är false.

generateNumberParts

boolean

True

Ett värde som anger om nummerunderord ska genereras. Standardvärdet är sant.

generateWordParts

boolean

True

Ett värde som anger om delord ska genereras. Om det anges genereras delar av ord. till exempel "AzureSearch" blir "Azure" "Search". Standardvärdet är sant.

name

string

Namnet på tokenfiltret. Den får bara innehålla bokstäver, siffror, blanksteg, bindestreck eller understreck, kan bara börja och sluta med alfanumeriska tecken och är begränsad till 128 tecken.

preserveOriginal

boolean

False

Ett värde som anger om ursprungliga ord ska bevaras och läggas till i underordslistan. Standardvärdet är false.

protectedWords

string[]

En lista över token som ska skyddas från att avgränsas.

splitOnCaseChange

boolean

True

Ett värde som anger om ord ska delas i caseChange. Om detta till exempel är inställt på sant blir "AzureSearch" "Azure" "Search". Standardvärdet är sant.

splitOnNumerics

boolean

True

Ett värde som anger om du vill dela på tal. Om detta till exempel är inställt på sant blir "Azure1Search" "Azure" "1" "Search". Standardvärdet är sant.

stemEnglishPossessive

boolean

True

Ett värde som anger om du vill ta bort avslutande "'s" för varje underord. Standardvärdet är sant.